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PRÉFACE À L’ÉDITION FRANÇAISE 


Le livre a son origine dans les cours professés par l’auteur pendant plu- 
sieurs années à l’Institut physico-technique de Moscou. Les chapitres I à X 
traitent du programme obligatoire de première année. On commence donc 
par les notions premières de la géométrie analytique dans le plan et dans 
l’espace, puis on passe à l’algèbre linéaire. L’exposé de la géométrie analy- 
tique vectorielle, qui en soi est utile aux futurs ingénieurs, constitue une 
bonne introduction à l’algèbre linéaire. 

Puisque le cours est destiné aux futurs ingénieurs physiciens, il n’y a 
aucune raison de présenter les résultats sous une forme trop générale. C’est 
ainsi, par exemple, que pour le corps de base on considère le corps des réels 
ou le corps des complexes ; en définissant les tenseurs, on n’introduit pas le 
produit tensoriel des espaces. Vu l’importance des applications, on ne se 
limite pas aux aspects géométriques et l’on recourt constamment aux matri- 
ces. Les principaux instruments sont les transformations élémentaires des 
matrices. 

Le volume du cours fondamental interdit de s’étendre sur les applica- 
tions de l’algèbre linéaire aux problèmes scientifiques et techniques. Les 
cinq derniers chapitres du livre représentent un cours facultatif consacré à 
l'application correcte des méthodes de l’algèbre linéaire. Ils sont conçus de 
manière à laisser à l’étudiant une entière liberté dans le choix de la matière : 
les chapitres XIII, XIV et XV sont pratiquement indépendants l’un de 
l’autre, bien que certains passages des chapitres XIV et XV, traitant des 
méthodes de calculs, impliquent d’étudier le chapitre XIII. Le théorème de 
décomposition spectrale d’une fonction de matrice qui fait l’objet du cha- 
pitre XII sert souvent de référence dans les chapitres suivants. Le théorème 
de Jordan n’est pas utilisé. 

Il existe de nombreux traités de théorie de programmation linéaire qui 
n’exigent pratiquement aucune formation mathématique. Dans ce livre, 
l’auteur a voulu présenter la programmation linéaire de manière à satisfaire 
le lecteur possédant un certain langage en mathématiques. 
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Dans les chapitres XI à XV, l’expose est parfois informatif, nombre de 
résultats sont donnés sans démonstration. Dans ces cas, on renvoie aux 
sources contenant la démonstration. : 

L'auteur s’est efforcé, sans sacrifier à la clarté ou à la rigueur, de rendre 
le livre aussi concis que possible. Il a de même essayé dans la mesure du 
possible de faire partager au lecteur son admiration pour l’élégance de 
l’algèbre linéaire. Au lecteur de juger s’il y a réussi. 


CHAPITRE PREMIER 


ALGÈBRE VECTORIELLE 


$ 1. Vecteurs 


1. Remarques préliminaires. Les premiers chapitres de ce livre peuvent 
être considérés comme le prolongement du cours de géométrie enseigné à 
l’école secondaire. On sait que chaque discipline mathématique s’appuie 
sur un système de propositions qui n’exigent pas de démonstration et qu’on 
appelle axiomes. Le lecteur peut trouver la liste complète d’axiomes de géo- 
métrie ainsi que les raisonnements détailles sur le rôle des axiomes en 
mathématiques dans le livre de N. Efimov [7] par exemple (les chiffres 
entre crochets sont des renvois à la liste d'ouvrages recommandés, insérée à 
la fin du livre). 

On ne se pose pas pour but d’exposer les bases logiques du sujet, aussi 
s’appuie-t-on tout simplement sur les théorèmes démontrés dans le cours de 
géométrie élémentaire. Tous nos résultats ne peuvent donc être pris pour 
démontrés que dans la mesure où ces théorèmes le sont. 

On ne tente pas non plus de définir les notions de base de la géométrie : 
point, droite, plan. Le lecteur curieux de leur introduction rigoureuse peut 
se référer au livre déjà mentionné de N. Efimov ; quant à nous, on admet- 
tra que ces notions, comme celles introduites dans le cours enseigné à 
l’école secondaire, sont connues du lecteur. 

On suppose de même connues, dès l’école secondaire, la définition des 
nombres réels et leurs propriétés principales. (La théorie rigoureuse du 
nombre réel est exposée dans les manuels d’analyse mathématique.) On uti- 
lisera largement le fait que, l’unité de mesure une fois choisie, on est en 
droit d’associer à chaque segment un nombre réel positif appelé sa lon- 
gueur. On admettra que l'unité de mesure des longueurs est choisie une fois 
pour toutes et, en parlant des longueurs de segments on ne mentionnera pas 
l’unité qui a servi à leur mesure. 


2. Définition du vecteur. Un segment de droite est défini par deux 
points équivalents, ses extrémités. Mais on peut envisager un segment 
orienté défini par un couple ordonné de points. De ces points on sait lequel 
est le premier (origine) et lequel est le deuxième (extrémité). 
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DÉFINITION 1. On appellera vecteur un segment orienté (ou, ce qui 
revient au même, un couple ordonné de points). On rattachera également 
aux vecteurs le vecteur dit #u/ dont l’origine et l’extrémité coïncident. 

Le sens sur le segment est habituellement marqué par une flèche. La 
notation littérale du vecteur est surmontée d’une flèche, par exemple, ÂAB 
(la lettre correspondant à l’origine du vecteur est obligatoirement écrite la 
première). Dans les livres, les lettres désignant un vecteur sont souvent 
imprimées en caractères demi-gras, par exemple a. Le vecteur nul est noté 0 
ou simplement 0. 

La distance entre l’origine et l’extrémité du vecteur est appelée sa /on- 
gueur (ou bien module ou valeur absolue). La longueur du vecteur est 
notée lal ou | 41. 

Les vecteurs sont dits colinéaires s'ils sont portés par une même droite 
ou des droites parallèles, bref, s’il existe une droite à laquelle ils sont paral- 
lèles. Les vecteurs sont dits coplanaires s’il existe un plan auquel ils sont 
parallèles. . 

Le vecteur nul est considéré colinéaire à tout vecteur, car il n’a pas de 
direction déterminée. Sa longueur est évidemment nulle. 

DÉFINITION 2. Deux vecteurs sont dits égaux s’ils sont colinéaires, de 
même sens et ont des longueurs égales. 

Il découle directement de cette définition qu’en choisissant un point 
arbitraire À ‘ on est en mesure de construire un (et un seul) vecteur 4 °B° 
égal à un vecteur donné AB, ou comme on dit, de transporter le vecteur AB 
au point À‘ (fig. 1). 


Fig. 1° 


3. Autre définition du vecteur. Remarquons que la notion d'égalité des vecteurs diffère 
sensiblement de celle des nombres. Tout nombre n'est égal qu'à lui-même, autrement dit, 
deux nombres égaux sont considérés comme un seul et même nombre en toute circonstance. 
Quant aux vecteurs, comme on le voit, il en est autrement : en vertu de la définition il existe 
des vecteurs différents mais égaux entre eux. Bien que dans la plupart des cas la nécessité de les 
distinguer ne sc présente pas, il peut arriver (voir p. 23) qu’on attache plus d'importance, à 
un certain moment, au vecteur ÀÂB et non au vecteur 4°B qui lui est égal. 

Pour simplifier la notion d'égalité des vecteurs (et lever certaines difficultés qui lui sont 
liées) on complique parfois la définition du vecteur. Tout en la formulant on n’utilisera pas 
cette définition compliquée. Afin d'éviter l'ambiguïté on écrira « Vecteur » (avec une lettre 
majuscule) pour désigner l'objet défini plus bas. 

DÉFINITION 3. Soit un segment orienté. On appelle Vecteur l'ensemble de tous les 
segments orientés égaux au segment donné au sens de la définition 2. 
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Donc, chaque segment orienté définit un Vecteur. Il est aisé de constater que deux seg- 
ments orientés définissent un même Vecteur si et seulement s’ils sont égaux. Pour les Vecteurs 
comme pour les nombres l’égalité signifie coïncidence : deux Vecteurs sont égaux si et seule- 
ment si c'est le même Vecteur. 

Au cas d'une translation dans l’espace, tout point de l’espace et son image constituent un 
couple ordonné et définissent un segment orienté, tous ces segments orientés étant égaux au 
sens de la définition 2. Aussi la translation de l’espace peut-elle être identifiée avec le Vecteur 
qui réunit tous ces segments orientés. 

On sait du cours élémentaire de physique que la force peut être représentée par un seg- 
ment orienté, mais ne peut pas l'être par un Vecteur, car les forces figurées par des segments 
orientés égaux effectuent en général des actions différentes. (Si la force agit sur un corps élas- 
tique, le segment orienté qui la représente ne peut être transporté même le long de la droite qui 
le supporte.) 

Ce n'est qu'une des raisons pour lesquelles à côté des Vecteurs, c'est-à-dire des ensembles 
(ou comme on dit des classes) de segments orientés égaux, on est obligé de tenir compte des 
représentants isolés de ces classes. Dans ces circonstances, l'utilisation de la définition 3 se 
complique de nombreuses restrictions. On se tiendra donc à la définition 1, et le lecteur com- 
prendra chaque fois, d’après le sens général, s’il s’agit d’un vecteur bien défini ou d’un vecteur 
qui peut être remplacé par tout vecteur qui lui est égal. 

En rapport avec la définition du vecteur il est utile d’élucider le sens de certains mots ren- 
contrés dans les livres. 

Au lieu de la définition 2 on peut introduire une autre définition de l’égalité des vecteurs 
selon laquelle les vecteurs sont égaux s'ils ont même longueur, même support ei même sens. 
Dans ce cas le vecteur peut être transporté non pas en tout point de l’espace mais seulement le 
long de la droite qui le supporte. Avec ce concept d'égalité, les vecteurs sont dits g/issants ou 
localisés sur une droite. En mécanique, la force agissant sur un solide parfait est représentée 
par un vecteur glissant. 

On peut de même ne pas introduire de concept particulier d'égalité de vecteurs et considé- 
rer que chaque vecteur n'est égal qu’à lui-même et se caractérise, en plus de la longueur et de la 
direction dans l’espace, par le point d'application. Dans ce cas les vecteurs sont dits liés (ou 
localisés en un point). Comme il a été indiqué la force agissant sur un corps élastique est repré- 
sentée par un vecteur lié. 

S'il est nécessaire de souligner que l'égalité est comprise au sens de la définition 2, on dit 
que ce vecteur est libre. On représente par un vecteur libre, par exemple, la vitesse angulaire 
d’un corps. 

4. Opérations linéaires sur des vecteurs. On appelle opérations linéaires 
l’addition des vecteurs et la multiplication du vecteur par un nombre. Rap- 
pelons leurs définitions. 

DÉFINITION. Soient donnés deux vecteurs a et b. Construisons les vec- 
teurs AB et BC qui leur sont égaux (c'est-à-dire transportons l’extrémité de 
a et l’origine de b au même point 2). Alors le vecteur AC est appelé somme 
des vecteurs a et b et est noté a + b. 

Remarquons qu’en choisissant au lieu de B un autre point, par exemple, 
B° on obtiendrait comme somme un autre vecteur 4 °C ” égal à AC. 

On appelle addition de vecteurs l’opération faisant correspondre à deux 
vecteurs leur somme. 

DÉFINITION. On appelle produit du vecteur a par un nombre réel a tout 
vecteur b satisfaisant aux conditions suivantes : 


a) Ibl = laœl lal ; 
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b) le vecteur b est colinéaire au vecteur a ; 

c) les vecteurs b et a sont orientés dans le même sens si & > 0, et dans 
les sens opposés si æ < 0. (Mais si æ = 0, il découle de la première condi- 
tion que b = 0.) 

Le produit du vecteur a par le nombre a est noté «a. 

La multiplication d’un vecteur par un nombre est une opération qui fait 
correspondre au vecteur et au nombre le produit du vecteur par ce nombre. 

Dans le cours enseigné à l’école secondaire on a déduit les principales 
propriétés des opérations linéaires. Enumérons-les sans démonstration. 


PROPOSITION 1. 1) L'addition des vecteurs est commutative, c'est-à-dire 
que pour tous vecteurs à et b on a a + b = b + a. 

2) L'addition des vecteurs est associative, c'est-à-dire que pour tous 
vecteurs a, bet conaa + (b + c) = (a + b) + c. 

3) L'addition du vecteur nul à tout vecteur a ne le modifie pas : 
a + 0 = a. 

4) Pour tout vecteur a le vecteur (— 1)a est son opposé, c'est-à-dire : 
a + (—-]1)a = 0. 

S) La multiplication d'un vecteur par un nombre est associative, c'est-à- 
dire que pour tous nombres « et B et tout vecteur a on a (aB)a = a(Ba). 

6) La multiplication d’un vecteur par un nombre est distributive par 
rapport à l'addition des nombres, c'est-à-dire que pour tous nombres a et B 
et tout vecteur a on a (a + B)a = aa + Ba. 

7) La multiplication d’un vecteur par un nombre est distributive par 
rapport à l'addition des vecteurs, c'est-à-dire que pour tous vecteurs a et b 
et tout nombre a on a a(a + Db) = aa + ab. 

8) La multiplication d’un vecteur par l'unité ne modifie pas ce vecteur : 
la = a. 

Le vecteur opposé au vecteur à est noté — a. On appelle différence des 
vecteurs à et b la somme du vecteur a et du vecteur opposé à b, c’est-à-dire 
le vecteur à + (—b) ou de façon condensée a — b. 

La soustraction est une opération inverse de l’addition, qui fait corres- 
pondre à deux vecteurs leur différence : à partir de la somme de deux vec- 
teurs b + x = a et de l’un des termes b on peut obtenir le deuxième terme 
x = a — D (fig. 2). 


Fig. 2. 
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La soustraction est définie à l’aide de l'addition, aussi ne la 
considérera-t-on comme une opération indépendante. On ne distinguera 
pas non plus la division d’un vecteur par le nombre &, qu’on peut définir 
comme une multiplication par le nombre &”!. 

En se servant des opérations linéaires on est en mesure de composer des 
sommes de vecteurs multipliés par des nombres : œ,a, + a,a, + 

. + a, a,. L'expression de ce type s’appelle combinaison linéaire de vec- 
teurs, et les nombres qui y figurent ses coefficients. 

Les propriétés d’opérations linéaires énoncées ci-dessus permettent de 
transformer les expressions constituées de combinaisons linéaires en se con- 
formant aux règles habituelles d’algèbre : on peut chasser les parenthèses, 
réduire les termes semblables, transporter certains termes d’un membre de 
l'égalité dans l’autre en changeant leurs signes, etc. 

Les huit propriétés d’opérations linéaires énoncées dans la proposi- 
tion 1 constituent, en un certain sens, un ensemble complet de propriétés : 
elles suffisent pour effectuer tout calcul utilisant les opérations linéaires sur 
des vecteurs, sans avoir recours aux définitions de ces opérations. Ce fait 
présentera par la suite (ch. VI) une importance de principe. 

Les combinaisons linéaires de vecteurs présentent les propriétés éviden- 
tes suivantes : si les vecteurs a,, …, a, sont colinéaires, toute combinaison 
linéaire de ces derniers leur est colinéaire ; si les vecteurs a,, ..…., a, sont 
coplanaires, toute combinaison linéaire de ces derniers leur est coplanaire. 
Cela découle aussitôt du fait que le vecteur æa est colinéaire à a et que la 
somme à + best située dans le même plan que a et b et même sur la même 
droite si les vecteurs à et b sont colinéaires. 

DÉFINITION. On appelle base d'un espace un triplet de vecteurs non 
coplanaires pris dans un certain ordre. 

On appelle base d’un plan un couple de vecteurs non colinéaires de ce 
plan pris dans un certain ordre. 

On appelle base d’une droïite tout vecteur non nul de ce support. 

Soulignons que les vecteurs de base d’un plan ne sont pas nuls, car si 
l’un d’eux l’était, ils seraient colinéaires. De même, deux vecteurs quelcon- 
ques de base d’un espace ne sont jamais colinéaires, sinon tous les trois 
seraient coplanaires. 

Si un vecteur est une combinaison linéaire de vecteurs, on dit qu’il est 
décomposé suivant ces vecteurs. Le plus souvent on envisage la décomposi- 
tion d’un vecteur suivant les vecteurs de base. 

DÉFINITION. Si |e,, 6,, e,} est une base de l’espace et a = a,e, + 
+ a,0, + «,6,, les nombres «,, «,,«, sont appelés composantes (ou coor- 
données) du vecteur à par rapport à la base considérée. 

D'une façon analogue, sont définies les composantes du vecteur dans 
un plan et sur une droite. Les composantes du vecteur s’écrivent entre 


0 E 
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parenthèses juste après la notation littérale du vecteur. Par exemple, 
a(1, 0, 1) signifie que les composantes du vecteur à par rapport à la base 
déterminée préalablement choisie sont 1, Oet 1. 


THÉOREME 1. Tout vecteur parallèle à une droite peut être décomposé 
suivant le vecteur de base de cette droite. 

Tout vecteur parallèle à un plan peut être décomposé suivant les vec- 
teurs de.base de ce plan. 

Tout vecteur peut être décomposé suivant les vecteurs de base de 
l'espace. 

Les composantes du vecteur se définissent dans chaque cas de façon 
univoque. 


DÉMONSTRATION. La première assertion signifie que pour tout vecteur 
a colinéaire à un vecteur non nul e (base d’une droite) il existe un nombre « 
tel que à = œe. Ce nombre est : soit lal / lel, soit —lal / lel suivant 
que à et e sont de même sens ou de sens contraires. 

La deuxième assertion signifie que pour tout vecteur a coplanaire à 
deux vecteurs non colinéaires @, et e, (base d’un plan) il existe des nombres 
@, et «, tels que à = «,68, + «,e,. Pour fixer ces nombres, plaçons les ori- 
gines des trois vecteurs au point O et menons par l’extrémité À du vecteur a 
la droite AP parallèle à e, (fig. 3). On a alors OA = OP + PA , OP étant 
colinéaire à e, et PA à e,.. (En particulier, l’un des vecteurs OP'et PA peut 
s’avérer nul.) En vertu de la première assertion du théorème il existe un a, 
et un &, tels que OP = a,e, et PA = æ,e,. Il s’ensuit que OÀ = a,e, + 
+ «,e,;. 

La troisième assertion du théorème signifie que pour tout vecteur à et 
des vecteurs non coplanaires e,, @, et e, il existe des nombres &,, «, et æ, 
pour lesquels à = æ,8, + «,e6, + «,e,. Pour le démontrer, plaçons les 
origines de tous les vecteurs au même point © (fig. 4) et menons par l’extré- 


A 


Fig. 3. 
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mité À du vecteur a la droite AP parallèle au vecteur e,. On a alors OA = 
= OP + PÂÀ , avec PÀ colinéaire à e, et OP coplanaire à 6, et e,. En vertu 
des assertions déjà démontrées, on obtient les nombres œ, @, et æ, tels que 
PA = «,e, et OP = ae, + a,e,. D'où découle directement la troisième 
assertion. 

Supposons qu’un vecteur a est décomposé suivant les vecteurs de base 
de l’espace de deux manières : a = a«,@, + a«,e, + a,e, et a = B,e, + 
+ B,e, + B,6,. En retranchant la deuxième expression de la première, on 
obtient (a, — 6,)e, + (a, — B,)e, + (a; — B,)e, = 0. Si au moins une 
des différences entre parenthèses n’est pas nulle, on est en mesure de 
décomposer l’un des vecteurs de base suivant les autres. Par exemple, avec 
a, — B, # 0, il vient 

ir 2 È 8, — à 63, 


ce qui est faux car les vecteurs de base ne sont pas coplanaires. La contra- 
diction obtenue démontre l’unicité de la décomposition suivant les vecteurs 
de base de l’espace. De façon analogue on démontre l’unicité de la décom- 
position dans les autres cas. Le théorème est complètement démontré. 
En reprenant la démonstration de la dernière partie du théorème, on 
remarquera qu’elle est également applicable à la proposition qui suit. 


PROPOSITION 2. Les vecteurs égaux possèdent les mêmes composantes. 


En géométrie analytique, les raisonnements géométriques sur les vec- 
teurs se réduisent à des calculs où participent les composantes de ces vec- 
teurs. Les deux propositions suivantes montrent comment on effectue les 
opérations connues sur les vecteurs au cas où sont données leurs composan- 
tes. 


PROPOSITION 3. Pour multiplier un vecteur par un nombre on multiplie 
tous ses composantes par ce nombre. 


En effet, si a = a,a, + «,6, + a;e,,ona 
Na = (ae, + a,e, + a,8,) = (Aa,)e, + (Aa,)e, + (\a,)e,. 
PROPOSITION4. Pour additionner les vecteurs on procède à l'addition de 
leurs composantes respectives. 
_ Eneffet,si a = a«,e, + «,e, + a;e;etb = 6e, + 6,e, + B,e,, il 
vient 
= (a, + B,)e, + (a, + B,)0, + (a, + B,)e,. 


5. Dépendance linéaire des vecteurs. La combinaison linéaire de plu- 
sieurs vecteurs est dite rriviale si tous ses coefficients sont nuls. Certes, la 
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combinaison linéaire triviale de vecteurs est égale au vecteur nul. La combi- 
naison linéaire est non ftriviale si au moins un de ses coefficients est diffé- 
rent de zéro. 


DÉFiniTioN. Les vecteurs a,, .., a, sont dits linéairement dépendants s’il 
existe une combinaison linéaire non triviale de ces vecteurs qui est égale à 
zéro ; autrement dit s’il existe des coefficients æ,, .…, a, pour lesquels 
aa, + … + aa, = Oet ai + … + af # 0. 

Dans le cas contraire, c’est-à-dire lorsque seule la combinaison linéaire 
triviale des vecteurs a,, .…, a, est nulle, ces vecteurs sont dits linéairement 
indépendants. Si les vecteurs sont linéairement indépendants, l’égalité 
œa, + .… + a,a, = Oentraîne a, = a, = .… = a, = 0. 

Signalons les propriétés suivantes de la dépendance linéaire. 

Si l’un des vecteurs a,, ..., a, est nul, ces vecteurs sont linéairement 
dépendants. En effet, considérons une combinaison lineaire de ces vecteurs 
dans laquelle le coefficient du vecteur nul est 1, tandis que les autres coeffi- 
cients sont égaux à 0. Cette combinaison linéaire n’est pas triviale et est 
égale à zéro. 

Si l’on ajoute un ou plusieurs vecteurs b,, …, b; aux vecteurs linéaire- 
ment dépendants a,, .., à, , les vecteurs a,, …, a,, b,, ..…, b, sont encore 
linéairement dépendants. En effet, à une combinaison non triviale nulle des 
vecteurs 4,, …, 4, on peut adjoindre les vecteurs b,, …, b; munis des coef- 
ficients nuls. 


PRropPosiTion 5. Les vecteurs sont linéairement dépendants si et seule- 
ment si l’un d'eux se décompose suivant les autres. 


DÉMONSTRATION. Supposons que &,,.., à, sont linéairement dépen- 
dants, c’est-à-dire qu’il existe des coefficients æ,, …, æ@, tels que œ,a, + 
+ a,4, + … + a,a, = Oet l’un au moins des coefficients, par exemple 
æ,, est différent de zéro. Dans ce cas, a, est une combinaison linéaire des 
vecteurs &,, .…, a,. En effet, on peut écrire 


(0 (0 4 
a, = — 2. a, 7 eee. _k a, . 
@ œ; 
Inversement, supposons qu’un des vecteurs àa,, ., a,, par exemple a,, se 


décompose suivant les autres, c’est-à-dire est une combinaison linéaire sui- 
vante : 


a, = P,a, + .…. + p,a,. 


Il s'ensuit immédiatement que la combinaison linéaire des vecteurs a,, 
a,, .…, à, à coëfficients — 1, 8,, .…., 8, est égale au vecteur nul. Vu qu’elle 
n'est pas triviale, les vecteurs &,, ..…, a, sont linéairement dépendants. La 
proposition est démontrée. 
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La notion de dépendance linéaire jouera un grand rôle dans la suite. 
Pour l’instant on peut s’en dispenser vu la signification géométrique banale 
de la dépendance linéaire des vecteurs. 


PROPOSITION 6. Deux vecteurs colinéaires sont toujours linéairement 
dépendants, et inversement, deux vecteurs linéairement dépendants sont 
colinéaires. 


En effet, soient donnés deux vecteurs colinéaires. S’ils sont tous deux 
nuls, l’assertion est évidente ; si l’un des vecteurs n’est pas nul, l’autre se 
décompose suivant ce vecteur. Dans les deux cas les vecteurs sont linéaire- 
ment dépendants. 

Inversement, en vertu de la proposition 5, de deux vecteurs linéairement 
dépendants l’un s’exprime en fonction de l’autre et par suite, ils sont coli- 
néaires. 


PROPOSITION 7, Trois vecteurs coplanaires sont toujours linéairement 
dépendants, et inversement, trois vecteurs linéairement dépendants sont 
coplanaires. 


DÉMONSTRATION. Supposons donnés trois vecteurs coplanaires. Con- 
sidérons deux quelconques d’entre eux. S’ils sont colinéaires, donc linéaire- 
ment dépendants, ils le seront encore avec le troisième vecteur. Par contre, 
si deux vecteurs ne sont pas colinéaires, le troisième se décompose suivant 
ces derniers, et les trois vecteurs sont linéairement dépendants en vertu de 
la proposition S. 

Inversement, de trois vecteurs linéairement dépendants l’un se décom- 
pose suivant les deux autres et, par suite, leur est coplanaire (et même coli- 
néaire, s’ils sont colinéaires). 


PROPOSITION 8. Quatre vecteurs sont toujours linéairement dépendants. 


En effet, considérons trois quelconques de ces quatre vecteurs. S'ils 
sont coplanaires, donc linéairement dépendants, ils le sont encore avec le 
quatrième vecteur. S’ils ne sont pas coplanaires, le quatrième vecteur se 
décompose suivant les trois autres, d’où il découle que les quatre vecteurs 
sont linéairement dépendants. 


$ 2. Systèmes de coordonnées 


1. Système de coordonnées cartésiennes. Fixons dans l’espace un 
point O et considérons un point arbitraire M. On dit que le vecteur OM est 
le rayon vecteur du point M relativement au point ©. Si outre le point O, 
on a choisi dans l’espace une base, il devient possible de faire correspondre 
au point M un triplet ordonné de nombres, composantes de son rayon vec- 
teur. 
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DÉFINITION. On appelle système de coordonnées cartésiennes (ou repère 
cartésien) de l’espace l’ensemble constitué d’un point et d’une base. 

Le point est dénommé origine des coordonnées ; les droites passant par 
l’origine des coordonnées et portant les vecteurs de base sont les axes de 
coordonnées. La première est l’axe des abscisses, la deuxième, l’axe des 
ordonnées, la troisième, l’axe des cotes. Les plans passant par les axes de 
coordonnées sont appelés plans de coordonnées. 


DÉFINITION. Les composantes du rayon vecteur du point M relativement 
à l’origine des coordonnées sont appelées coordonnées du point M dans le 
système considéré de coordonnées. 

La première coordonnée est l’abscisse, la deuxième, l’ordonnée et la 
troisième, la cote. 

Les coordonnées cartésiennes dans le plan et sur la droite se définissent 
de façon analogue. Il va de soi que dans le plan un point ne possède que 
deux coordonnées (l’abscisse et l’ordonnée) et sur la droite qu’une seule. 

Les coordonnées d’un point s’écrivent habituellement entre parenthèses 
après la lettre désignant le point. Par exemple, l'écriture À (2, 1/2) signifie 
que le point À du plan a pour coordonnées 2 et 1/2 par rapport au repère 
cartésien préalablement choisi dans ce plan (fig. S). 


e; 
A(2,4) 


O e, 
Fig. S. 


Il est aisé de voir qu'avec le repère donné les coordonnées d’un point 
sont définies de façon univoque. Réciproquement, étant donné un repère, à 
tout triplet ordonné de nombres correspond un point et un seul dont les 
coordonnées sont ces nombres. Le repère du plan définit une correspon- 
dance analogue entre les points du plan et les couples ordonnés de nom- 
bres. 

Considérons deux points À et B dont les coordonnées par rapport au 
système de coordonnées cartésiennes {O, 6,, e,, e,] sont respectivement x,, 
ir 2 €tX2, Jr, 2. Cherchons les composantes du vecteur AB. Il est évident 
que AB = ÔE - OÀ (fig. 6). De par la définition des coordonnées les 
composantes des rayons vecteurs OÀ et OB sont (x,,Y,, 4) et (x, }:, 2). 
Selon la proposition 4 du $ 1, le vecteur AB possède les composantes 
(x, — X,,ÿ: — },, Z — 2,). On a ainsi démontré la proposition suivante. 


PROPOSITION 1. Pour obtenir les composantes d’un vecteur il faut retran- 
cher les coordonnées de son origine de celles de son extrémité. 
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Blx,, 2. 22) 


e: 
Fig. 6. 


2. Partage d’un segment dans un rapport donné. Cherchons les coor- 
données du point M situé sur le segment AB et le partageant dans le rapport 
N/u, c’est-à-dire satisfaisant à la condition 

lAM À 


EN = 0: > 0 
IMB k d 


(fig. 7). Cette condition peut être écrite sous la forme 
uAM = \MB. (1) 


En désignant par (x,, y,, z,) et (x;, y,, z,) les coordonnées respectives des 
points À et Bet par (x, y, z) celles du point M, décomposons les deux mem- 


6; 
Fig. 7. 


bres de l'égalité suivant les vecteurs de base et utilisons la proposition 1 
: = mt 
pour obtenir les composantes des vecteurs AM et MB. On a alors 


U(x — x,) = À(Xx, — x), 

UC — y,) = AU: — y), 

u(z — z,) = À(Z — 2). 
Ces égalités permettent d’obtenir x, y et z vu que À + u # 0. On obtient en 
définitive 


LHX+AX CU} t AY, _ HZ + ÀZ 2 
x , } D: ; (2) 
À +u À +u À +u 
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Ces formules sont connues sous le nom de formule de partage d'un seg- 
ment dans un rapport donné. 

Si dans les formules (2) l’un des nombres À ou y est strictement négatif, 
il résulte de l'égalité (1) que le point M{(x, y, z) est situé sur la même droite 
mais à l'extérieur du segment AB, en le partageant dans le rapport lX\/ul. 
Aussi les formules (2) constituent-elles la solution d’un problème plus géné- 
ral ; elles permettent de trouver les coordonnées d’un point partageant le 
segment AB dans un rapport donné, intérieurement et extérieurement. 

Dans le plan, le problème de partage d’un segment se résout de la même 
façon, à la seule différence que la base n’est constituée que de deux vec- 
teurs et, par suite, des formules (2) il ne reste que deux. 


3. Repère cartésien rectangulaire. De tous les repères cartésiens on uti- 
lise le plus souvent des repères qui forment une classe spéciale des repères 
Cartésiens rectangulaires. 

DÉFINITION. Une base est dite orthonormée si ses vecteurs sont unitaires 
et deux à deux orthogonaux. Le repère cartésien dont la base est orthonor- 
mée est appelé repère cartésien rectangulaire. 

Il n’est pas difficile de vérifier que les coordonnées d’un point par rap- 
port à un repère cartésien rectangulaire sont, en valeur absolue, égales aux 
distances de ce point jusqu'aux plans de coordonnées respectifs. Elles sont 
strictement positives ou négatives suivant que le point et l’extrémité du vec- 
teur de base se trouvent d’un même côté ou de part et d’autre du plan de 
coordonnées auquel est perpendiculaire ce vecteur. 

De façon analogue, on obtient les coordonnées d’un point par rapport à 
un repère cartésien rectangulaire dans le plan. 


4. Système de coordonnées polaires. Les repères cartésiens ne sont pas 
les seuls repères qu’on utilise pour déterminer la position d’un point par 
rapport à une certaine image géométrique. Il existe beaucoup d’autres 
systèmes de coordonnées. On décrira ici quelques-uns d’entre eux. 

On utilise souvent dans le plan le système de coordonnées polaires. Il est 
défini si est donné un point © appelé pôle, et une demi-droite / issue de O, 
appelée axe polaire. La position d’un point M est fixée par deux nombres : 
le rayon r = lOM1 et l’angle 4 entre l’axe polaire et le vecteur OM. 
L’angile & est appelé angle polaire. On le mesure en radians à partir de l’axe” 
polaire dans le sens contraire à celui du mouvement des aiguilles d’une 
montre. Pour le pôle O on a r = Det # est indéterminée. Pour les autres 
points, r > Det # est déterminé au multiple de 27 près. Cela signifie que, 
par exemple, les couples de nombres (r, &), (r, #$ + 2x) et, en général, 
(r,« + 2kx), où k est un entier quelconque, représentent les coordonnées 
polaires d’un même point (fig. 8). 

On limite parfois la variation de l’angle polaire en introduisant diverses 
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conditions, par exemple : 0 < w < 2r ou —7r < #'< +. Ce procédé sup- 
prime la non-univocité maïs introduit d’autres inconvénients. 

Soient donnés un système de coordonnées polaires et un couple 
ordonné (7, £ÿ) de nombres dont le premier est positif. On peut faire corres- 
pondre à ce couple un point dont les coordonnées polaires sont ces nom- 
bres, à savoir : sir = 0, c’est le pôle qu’on fait correspondre, sir > 0, c’est 
le point dont le rayon vecteur est de longueur r et forme l’angle Y avec l’axe 
polaire. Ceci étant, aux couples (r, #)et (r,, w,) correspond un même point 
sir = rete — w, = 27k, où k est un entier. 


P+27 


Fig. 8. 


Choisissons dans le plan un repère cartésien rectangulaire en plaçant 
son origine au pôle O et en prenant pour vecteurs @,, 6, les vecteurs de lon- 
gueur 1 dirigés respectivement le long de / et sous l’angle x/2 à / (l’angle 
étant mesuré dans le sens contraire au mouvement des aiguilles d’une mon- 
tre). Il découle aisément de la figure 8 que les coordonnées cartésiennes du 
point s'expriment par ses coordonnées polaires de la manière suivante : 


X =rcoS®, } = FrsSin @. (3) 


S. Coordonnées cylindriques et sphériques. Les systèmes de coordonnées cylindriques et 
sphériques sont une généralisation dans l’espace des systèmes de coordonnées polaires. Pour 
les uns comme pour les autres, la figure par rapport à laquelle on détermine la position d’un 
point est composée d'un point ©, d'une demi-droite / issue de © et d'un vecteur n de longueur 
unité perpendiculaire à /. Par le point O on peut mener le plan P perpendiculaire au vecteur n. 

Soit un point M. Traçons par ce point la perpendiculaire MM ‘au plan P. 

Les coordonnées cylindriques du point M sont représentées par trois nombres (7, w, h). 
Les nombres r, # sont les coordonnées polaires du point M ° par rapport au pôle O et l'axe 
polaire /, tandis que h est la composante du vecteur MM suivant n. Elle est déterminée car 
ces vecteurs sont colinéaires (fig. 9). 

Les coordonnées sphériques d'un point sont trois nombres (7, #, 9). Elles se déterminent 
de la façon suivante : r = | |, comme pour les coordonnées cylindriques est l’angle entre 
le vecteur OM "et la demi-droite /, tandis que 8 est l’angle que fait le vecteur OM avec te plan 
P (fig. 10). 
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Fig. 9. 


$ 3. Produits scalaire et vectoriel 


1. Produit scalaire. On entend par angle de deux vecteurs l’angle formé 
par deux vecteurs égaux aux vecteurs donnés et ayant une origine com- 
mune. Quelquefois, on indiquera le vecteur à partir duquel on mesure cet 
angle, et le sens dans lequel on le fait. En l’absence de telle indication, 
l’angle de deux vecteurs est celui qui est inférieur à x. Si l’angle est droit, 
les vecteurs sont dits orthogonaux. 

DÉFINITION. On appelle produit scalaire de deux vecteurs le nombre égal 
au produit des longueurs de ces vecteurs par le cosinus de l’angle qu’ils for- 
ment. Si l’un des vecteurs est nul, l’angle n’est pas déterminé et le produit 
scalaire est égal à zéro par définition. 

Le produit scalaire des vecteurs a et b est représenté par (a, b). On peut 
donc écrire 


(a, b) = lal Ibl cos y, 


où # est l’angle des vecteurs a et b. L'opération de multiplication scalaire 
jouit des propriétés évidentes suivantes : 

1. La multiplication scalaire est commutative, c'est-à-dire (a, b) = 
= (b, a) pour tous vecteurs a et b. 

2. (a, a) = lal? pour tout vecteur a. 

3. Le produit scalaire est nul si et seulement si les facteurs sont orthogo- 
naux ou si l’un d'eux au moins est nul. 

4. Les vecteurs d’une base orthonormée satisfont aux relations 


(e,, e,) _ (e,, e.) — (e,, e.) = 1, 
(e,, e,) = (e,, e,) = (e,, 6,) = 0. 


PROPOSITION 1. Si les vecteurs de base 8, @,, 6, sont orthogonaux, les 
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composantes de tout vecteur a s’obtiennent d’après les formules 


= (a, 6) _ (a, e.) = (a, e.) 
MT Ter” ‘2? el?’ ‘? le, 


En particulier, si la base est orthonormée, on a 
œ; Du (a, e,), 1e à) (a, e;), X — (a, e.). (1) 


En effet, soit a = a, + a, + a,, chaque terme étant colinéaire au vec- 
teur de base respectif. On sait de la démonstration du théorème 1, $ 1, que 
a, = +la,l /le,l, le signe étant plus ou moins suivant que les vecteurs a, 
et e, sont de même sens ou de sens contraires. Or il découle de la figure 11 
que +la,l = lal cosw,, où y, est l’angle des vecteurs a ete,. Ainsi, «, = 
= lal cosy, / le,l = (a,e,) / le,l?. De façon analogue se calculent les 
autres composantes. 


Fig. 11. 


De la proposition 1 il découle que chacune des composantes du vecteur 
a par rapport à une base orthonormée est égale au produit de sa longueur 
par le cosinus de l’angle que ce vecteur fait avec le vecteur de base corres- 
pondant. 

La propriété suivante est dénommée linéarité du produit scalaire. 

PROPOSITION 2. Quels que soient les vecteurs a, b, c et les nombres a et 
B, on a l'égalité (aa + Bb, c) = a(a, c) + B(b, c). En particu- 
lier, (aa, C) = a(a, cet (a + b,c) = (a, c) + (b, c). 

DÉMONSTRATION. Si C = 0, l’assertion est évidente. Posons C # 0. 
Convenons que c est le premier vecteur de base. Choisissons les deux autres 
de façon qu'ils soient orthogonaux entre eux et au premier vecteur. 
L'expression («a + Bb, c) / Ici? est la première composante du vecteur 
aa + Bb. D'une façon analogue, (a, c) / Icl?et (b, c) / cl? sont les pre- 
mières composantes des vecteurs a et b. En vertu des propositions 4 et 3 du 
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$l1,ona 
(œa + Bb,c)/1Icl?= œ({a,c)/1cl° + 8(b,c)/1cl;, 
d’où l'égalité exigée. 
On démontre aisément que la combinaison linéaire d’un nombre quel- 
conque de vecteurs vérifie une formule analogue. 


Profitant de la commutativité de la multiplication scalaire, on obtient 
de la proposition 2 l’identité suivante : 


(a, Bb + yc) = B(a, b) + y(a, c). 


Soit donnée une base orthonormée. Etudions comment le produit sca- 
laire des vecteurs a et b s’exprime au moyen de leurs composantes (œ,, æ, 
æ;) et (B,, B, B;). En s'appuyant sur la linéarité du produit scalaire par 
rapport au premier facteur, écrivons 


(a, b) = (œ«,e, + x,e, + «,e,,b) = a,(e,, b) + «.(e,, b) + x,(e,, b). 


Mais en vertu de la proposition 1, les produits scalaires du vecteur b par les 
vecteurs de base sont égaux à ses composantes $,, 6, et B,. On aboutit ainsi 
au théorème suivant. 


THÉOREMEÏ1. Si /a base est orthonormée, le produit scalaire des vecteurs 
s'exprime au moyen de leurs composantes suivant la formule 


(a, D) = «,B, + æ,B, + a;B;. (2) 


Soulignons l’importance de l’exigence, dans ce théorème, d’une base 
orthonormée, car rapportée à toute autre base l’expression du produit sca- 
laire en fonction des composantes est beaucoup plus compliquée. Aussi 
dans les problèmes où interviennent les produits scalaires emploie-t-on des 
bases orthonormées. Mais si pour des raisons quelconques il s’avère néces- 
saire de calculer le produit scalaire par rapport à une base non orthonor- 
mée, il faut multiplier scalairement les facteurs décomposés suivant les vec- 
teurs de base et, en chassant les parenthèses, porter dans l’expression obte- 
nue les produits scalaires connus des vecteurs de base. 

Le théorème 1 permet d’exprimer la longueur du vecteur en fonction de 
ses composantes par rapport à une base orthonormée : 


lal = Vai + a; + a*, (3) 
ainsi que l’angle de deux vecteurs en fonction de leurs composantes par 
rapport à une base orthonormée : 


ve (a, b) : œ@,B, + aB, + a;B;, (4) 


Fal1bl  V(a+a?+a8?+82+68) 
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En se servant de la formule (3), on est en mesure de calculer la distance 
de deux points si sont données leurs coordonnées par rapport à un repère 
cartésien rectangulaire. En effet, supposons que les points 4 et B possèdent 
les coordonnées respectives (x, y, z) et (x,, y,,z,). Alors la distance entre 
ces points est égale à 


LAB = V(x,- x} + 0-7} +(2 2). (5) 


2. Orientation d’un triplet de vecteurs. Soient données deux bases 
orthonormées {e,, e,, e,] et {e,, e,, e, |. Peut-on faire coïncider ces bases 
à l’aide d’un déplacement? On peut évidemment transporter et imprimer 
un mouvement de rotation au vecteur e, de manière qu’il s'applique sur le 
vecteur e,. Dans ce cas, le plan des vecteurs @, et e,, perpendiculaire 4 e,, 
sera amené sur le plan des vecteurs €, et e,, perpendiculaire à e,. Ensuite, 
par rotation, on peut faire coïncider les vecteurs e, et e,. Les vecteurs e, et 
6, seront alors colinéaires. Ceci étant, ou bien ils se confondront, les bases 
coïncidant, ou bien ils seront opposées, les bases ne pouvant alors s’appli- 
quer l’une sur l’autre. 

Il découle de ce raisonnement que, si deux bases ne peuvent être ame- 
nées l’une sur l’autre, toute autre base s’applique soit sur la première, soit 
sur la deuxième. Ainsi, toutes les bases orthonormées se partagent en deux 
classes. Les bases d’une même classe se superposent, tandis que les bases 
des classes différentes ne se superposent pas. La base est dite orientée à 
droite (directe) ou à gauche (rétrograde) suivant que le vecteur e, est 
orienté à droite ou à gauche, e, s’éloignant de nous et le vecteur @, se diri- 
geant vers le haut (fig. 12). L’une des classes comprend toutes les bases 
directes et l’autre toutes les bases rétrogrades. Cette définition s’étend à 
toutes les bases de la façon suivante. 


e; 


e) 


b) 


Fig. 12. a) Haw rétrograde: D) hase diroctc 


DÉFINITION. Un triplet ordonné de vecteurs non coplanaires est dit 
orienté à droite (ou direct) si de l’extrémité du troisième vecteur la plus 
petite rotation du premier vecteur vers le deuxième s’observe dans le sens 
contraire au mouvement des aiguilles d’une montre. Dans le cas contraire, 
le triplet est dit orienté à gauche (ou rétrograde). (Les origines des vecteurs 
du triplet sont supposées confondues.) 
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3. Produit vectoriel. DÉFINITION. Soient donnés deux vecteurs a et b. 
Construisons un vecteur C satisfaisant aux conditions suivantes : 

1) ic! = lal Ibl sin $ *), où # est l’angle entre a et b ; 

2) le vecteur C est orthogonal aux vecteurs a et b ;: 

3) si a et b ne sont pas colinéaires, les vecteurs a, b, c forment un triplet 
direct de vecteurs. 

Le vecteur ainsi construit est appelé produit vectoriel des vecteurs a et b 
et désigné par {a, b]. Les conditions mentionnées définissent le produit vec- 
toriel à l’égalité près si les facteurs ne sont pas des vecteurs nuls. Si l’un au 
moins des facteurs est nul, le produit vectoriel est par définition le vecteur 
nul. 

Il découle de la définition que le module du produit vectoriel de deux 
vecteurs non colinéaires est numériquement égal à l’aire du parallélo- 
gramme construit sur les facteurs (au cas où les facteurs ont une origine 
commune). 

Le produit vectoriel est nul si et seulement si les facteurs sont 
colinéaires **). 


EXEMPLE ]. Soit |e,, e,, e,} une base directe. Alors 
[e,,e,] = e,, [e,, e,] = e,, [e,, e,] = e,. Si {f,, f,, f,} est une base 
orthonormée rétrograde, [f,, 8] = “{, (8, f,] = -f,[(f,f] = —-f.. 


PROPOSITION 3. La multiplication vectorielle est anticommutative, 
c’est-à-dire qu’on a toujours [a, b] = —[b, a]. 


En effet, il résulte de la définition que le module du produit vectoriel est 
indépendant de l’ordre des facteurs. De même, le vecteur [a, b] est coli- 
néaire au vecteur [b, a]. Toutefois, en permutant les facteurs, on est obligé 
de changer le sens du produit pour que soit remplie la condition 3) de la 
définition. En effet, si a, b, [a, b] forment un triplet direct, b, a, [a, b] 
forment alors un triplet rétrograde, et b, a, —[a, b] de nouveau un triplet 
direct. 

On reviendra plus bas au produit vectoriel mais, avant de le faire, on va 
introduire encore une opération. 


4. Produit mixte. DÉFINITION. Le nombre (a, [b, C]) est appelé produit 
mixte des vecteurs à, b, c et noté (a, b, c). 


PROPOSITION 4. Le produit mixte des vecteurs non coplanaires a, b et c 
est égal en module au volume du parallélépipède construit sur les facteurs. 
Il est positif si le triplet a, b, c est direct et négatif s’il est rétrograde. 


*“)sins > 0,car0<vw< +. 
+*e) On a convenu de considérer que le vecteur nul est colinéaire à tout vecteur. 
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Fig. 13. 


En effet, le volume du parallélépipède construit sur les vecteurs à, b'et 
c est égal (fig. 13) au produit de l’aire de la base ![b, c]l par la hauteur 
lal cos 81, où 8 est l’angle des vecteurs a et [b, c]. On peut donc écrire 


V = 1[b, c]l lal lcos 81 = l(a, [b, c})l = l(a, b, c)i. 


Ainsi, la première assertion est démontrée. Le signe du produit mixte 
coïncide avec celui de cos 6, et par suite, le produit mixte est positif lorsque 
les vecteurs a et [b, c] sont orientés de la même façon par rapport au plan 
des vecteurs b et C, c’est-à-dire quand le triplet {a, b, c] est direct. On 
démontre de façon analogue que le produit mixte du triplet rétrograde de 
vecteurs est négatif. 

Si {e,, e,, e,] est une base orthonormée, on a (e,, e,, e,) = 1 ou 
(e,,e,,e,) = —]1 suivant que la base est directe ou rétrograde. 


PROPOSITION S. Le produit mixte est nul si et seulement si les facteurs 
sont coplanaires. 


En effet, (a, b, c) = lall!{b, c]i cos 8, où 8 est l’angle des vecteurs a et 
[b, c]. L'égalité lal!{b, c]l cos 9 = 0 n’est possible que si est satisfaite 
l’une au moins des conditions : 


a) lal = 0. Alors les vecteurs sont évidemment coplanaires. 
b) l[b, c]l = O0. Alors bet c sont colinéaires et, partant, a, b'et c sont 
coplanaires. 


c) cos 8 = 0. Alors le vecteur a est orthogonal à [b, c],<’est-à-dire est 
coplanaire à b et c. 

La proposition réciproque se démontre de façon analogue : si a, bet C 
sont coplanaires et on n’est pas dans les cas a) et b), c’est le cas c) qui joue. 

Avec la permutation des facteurs dans le produit mixte, seule l’orienta- 
tion du triplet des vecteurs peut au plus subir une variation. Aussi, en vertu 
des propositions 4 et 5, seul le signe du produit mixte peut-il se modifier. 
Pour tous vecteurs a, b et C, on obtient en comparant les orientations des 


3— 6442 


34 ALGÈBRE VECTORIELLE [CH. 1! 


triplets de vecteurs : 
(a, b, c) = (c, a, b) = (b, c, a) = 
= —(b,a,c) = —-(c,b,a) = -(a,c,b). (6) 


En appliquant la proposition 2 au produit scalaire (a, + ua,, [b, C]), 
on obtient l’identité 
(Aa, + ua,,b,c) = X(a,,b,c) + u(a,,b, c). (7) 


Les égalités (6) entraînent des identités analogues pour les autres facteurs. 
Par exemple, pour le deuxième facteur on a 


(a, Ab, + ub,, cc) = (a, b,, c) + u(a, b,, c). 


En effet, on est en mesure de permuter les facteurs et mettre à la pre- 
mière place celui qui nous intéresse, chasser les parenthèses, puis procéder 
à la permutation inverse. 

Les identités obtenues expriment la propriété de linéarité du produit 
mixte. 

Démontrons maintenant la linéarité du produit vectoriel. 


PROPOSITION 6. Pour tous vecteurs à, b et c et tous nombres X et on a 
l'égalité 
[Xa + ub, C] = X[a, c] + u[b, c]. 
Pour le démontrer, profitons de la linéarité du produit mixte par rap- 
port au deuxième facteur : 


(d, [Aa + ub, c]j) = X(d, [a, c]) + u(d, [b, c]). 


Cette égalité est vérifiée pour tout d. On peut choisir une base orthonormée 
1e, 8, 6,) et substituer successivement à d chacun des vecteurs de cette 
base. En vertu de la proposition 1, on obtient l’égalité de toutes les compo- 
santes des vecteurs [a + ub, c]et X[a, c] + u[b, c], et, partant, l'égalité 
qu'il fallait démontrer. 

De façon analogue, on peut démontrer la linéarité du produit vectoriel 
par rapport au deuxième facteur. 

d. Produits mixte et vectoriel exprimés en fonction des composantes des 
facteurs. Etant donné la décomposition des vecteurs à et b suivant les vec- 
teurs de base 6,, e, et 6,, on peut écrire, en vertu de la proposition 6, 


[a, b] = {[fa, @, + x, 6, + a,e,},{6, e, + B,e, + 6,e,)] = 
= (a, 8, — a, B)le,, e,] + (a, 8, — a, B,)le,, 6,] + 
+ (œ, 8, — a, B,)(e,,68,]. (8) 
Comme on l’a vu dans l’exemple 1, on a dans une base orthonormée : 
[e,, e,] = +e,, [6,,8,] = +e,, [6,,e,] = +e.,, 
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où le signe est plus si la base {e,, e,, e,] est directe, et moins si la base est 
rétrograde. Pour éviter les permanentes remarques sur l’orientation de la 
base, on admettra que la base est toujours directe. Ainsi donc, on obtient le 
théorème suivant. 


THÉORÈME 2. Dans une base orthonormée, le produit vectoriel est 
exprimé au moyen des composantes des facteurs par la formule 


[a, D] = (œ, 8, — a,B,)e, + (a, B, — a, B,)e, + (x, B, — «,B,)e;. 


(Si la base est rétrograde, il faut mettre le signe moins devant l’un des 
membres de cette égalité.) 
On est maintenant en mesure de démontrer le théorème suivant. 


THéorèÈME 3. Le produit mixte des vecteurs à, b et c s'exprime en fonc- 
tion de leurs composantes (a,, «,, æ,), (B,, B,, B,) et (y,, y, y,) rapportées 
à une base quelconque |e,, e,, e.| par la formule 


(a, D, c) = (a, 8,7, + a, 8,7%, + a, B, y — 
— a 6% — & B, 7; — à, 6, 7), 6,,e,). 
Pour le démontrer, explicitons le produit [b, C] suivant la formule (8) : 
[b, c] = (8, y, — 8, v.)le,, e,] + (8, 7, — 8, v,)le,, e,] + 
+ (8, Y — B, v,)le,, e,]. 
En multipliant scalairement les deux membres de cette égalité par le vecteur 
a = «,e, + a,e, + a,e,, on obtient 
(a, [b,c]) = «,(8,%, — B,Y,)(e,,[e,,e,]) + æ,(8,7, — B,7,Xe,,[e,,e,]) + 
+ @,(B, 7: — B, %,)(6,, [e,, e,]). 
(Les termes contenant les produits mixtes avec facteurs égaux ne sont pas 


écrits, vu qu’ils sont nuls.) D’où, compte tenu des égalités (6) et en rédui- 
sant les termes semblables, on obtient le résultat cherché. 


6. Déterminants d’ordre 2 et 3. Les formules trouvées pour les produits 
vectoriel et mixte sont assez encombrantes. Pour une écriture plus parlante 
on utilise les déterminants d’ordre 2 et 3. 

Considérons quatre nombres &,, &,, B,, B,. On peut en composer un 


tableau 
a 
B, B; 


appelé matrice d'ordre 2. Le nombre a, 6, — a,B, est appelé déterminant 
de la matrice d'ordre 2 ou tout simplement déterminant d'ordre 2. Il est 


+ 
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noté 
| % 


8, B 


Le produit vectoriel rapporté à une base orthonormée peut maintenant 
s’écrire comme suit : 

Œ, © Q; 

[a, b] _ | 2 3 3 “1 


œ 
B, B; 6; 8, 8, B; 


A partir des composantes de trois vecteurs on peut composer un. 
tableau, appelé matrice d'ordre 3 


6, + 2 6, . 


@, 2 A3 
B, 82 B3 
V1 
Le nombre 
| 82 B; B; F1 4 a B2 
Y2%3 3 Yi Y1 Y2 
ou, ce qui revient au même, 
B, B, B, B, 8 B, 
V 3 NY "2 


est appelé déterminant de la matrice d'ordre 3 ou déterminant d'ordre 3 et 
noté 


ef œ; a; 
8, B, B; 
NY 
Suivant le théorème 3, on a en nouvelles notations : 
a, æ 
(a, b,c) = |B, 8, B,] (6,,6,,e.). (S) 
NY 
En particulier, on a par rapport à une base orthonormée : 
&j 82 3 
(a, b, c) = |8, B, B,]|. (10) 
NY 


Le théorème 2 et la définition du déterminant d’ordre 3 permettent 
obtenir l'écriture suivante du produit vectoriel en fonction des composan- 


$ 3] PRODUITS SCALAIRE ET VECTORIEL 37 


tes des facteurs par rapport à une base orthonormée {6,, e,, e, : 
199 
[a, D] = a, œ, a). (11) 
Bi 82 85 


Les déterminants sont étroitement liés aux systèmes d’équations linéai- 
res dont il est commode d'écrire les solutions en s’en servant. Une grande 
partie du chapitre V y sera consacrée. En attendant, on ne fournira qu’une 
illustration géométrique. 

Soit donné un système de trois équations à trois inconnues 


ax+by+cz=f;, 
ax +b,y+0c,z=f,, 
ax +b,y +0c,2z=/f.. 


Fixons dans l’espace une base et considérons les vecteurs a(a,, a,, a,). 
b(b,,b,,b,),c(c,,c;,c,)etf(,,/,,/,). On peut alors considérer Île 
système comme une écriture en coordonnées de l’égalité vectorielle 


xa +yb+2zc=tf. (12) 


Les coefficients x, y, z de la décomposition de f suivant les vecteurs a, b et 
C représentent donc une solution du système. On peut s’assurer que le 
système possède une solution unique si à, b et C ne sont pas coplanaires, 
c’est-à-dire si (a, b, c) # 0. Admettons que cette condition est satisfaite et 
cherchons la solution. A cet effet, multiplions les deux membres de l’égalité 
(12) scalairement par le produit vectoriel {b, c]. On obtient x(a, b, c) = 
= (f, b, C) et, par suite, x est égal au rapport des déterminants 


JS, LS a, 4 4; 
b, b, b,| et |b, b, b, 
€ QG G GG 


De façon analogue on obtient les autres inconnues. 

Arrêtons-nous sur les propriétés suivantes des déterminants. Il découle 
des égalités (6) que le déterminant change de signe lorsqu'on permute deux 
lignes de la matrice. La formule (7) nous donne 


Na, + ua, }a, + ua, No, + ua, | ‘ œ, @ @, a, &; @, 
B, B; B; = À B, B; B, + u 6, B;, B, 
Yi V2 V3 NY Vi NV 


7. Conditions de colinéarité et de coplanarité des vecteurs. Commen- 
çons par énoncer la proposition utile suivante. 
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PROPOSITION 7. Quelle que soit la base |e,, e,, e,|, les produits vectoriels 
[e,, e.], (e,, e,], [e,, e,] sont linéairement indépendants. 


Pour la démontrer, raisonnons par l’absurde. Considérons une combi- 
naison linéaire des vecteurs qui nous intéressent et supposons qu’elle soit 
égale à zéro : 

\[e,, e,] + ufe,,e,] + v[e,,e,] = 0. 


Admettons qu’un des coefficients, soit À pour fixer les idées, est différent 
de zéro. Multiplions la combinaison linéaire par e,. On obtient 
N(e,, e,, e,) = 0, c’est-à-dire À = 0. La contradiction obtenue démontre 
la proposition. 

Les propositions qui suivent énoncent les conditions nécessaires et suf- 
fisantes de la colinéarité et de la coplanarité des vecteurs. 


PROPOSITION 8. Pour que trois vecteurs soient coplanaires il est néces- 
Saire et suffisant que la matrice de leurs composantes ait le déterminant 
nul. 

La proposition 8 résulte immédiatement de la proposition 5 et de la for- 
mule (9), vu que (@,, e,, e,) # 0. 


PROPOSITIONQ. Soient (œ,, æ;, &,) et (B,, B,, B,) les composantes des 
vecteurs à et D par rapport à une base donnée quelconque. Ces vecteurs 
sont colinéaires si et Seulement si 


> À; a; A] -|° œ 
B, B; B, B, B, B: 


La suffisance de la condition est évidente : de l’égalité (13), en appli- 
quant la formule (8), on obtient que [a, b] = 0, ce qui équivaut à la coli- 
néarité des vecteurs. Notons que la formule (8) est vérifiée par rapport à 
toute base, de sorte qu’on peut ne pas exiger qu’elle soit orthonormée. 
Inversement, de la condition [a, b] = Oet de la formule (8) on peut déduire 
(13), car les vecteurs [e,, e,], [e,, e.] et [e,, e,] sont linéairement indépen- 
dants en vertu de la proposition 7. 

En géométrie plane, la colinéarité de deux vecteurs s’établit par la pro- 
position suivante. 


= (. (13) 


PROPOSITION10. Pour que deux vecteurs dans le plan soient colinéaires il 
est nécessaire et suffisant que la matrice de leurs composantes ait le déter- 
minant nul. 


Pour le démontrer, on admettra que le plan considéré est placé dans 
l’espace et que la base dans le plan est complétée par le troisième vecteur 
pour avoir une base dans l’espace. Le vecteur a de coordonnées (aæ,, a.) 
dans le plan acquiert alors les coordonnées (&,, æ,, 0) relativement à la 
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base dans l’espace. En appliquant maintenant la proposition 9 aux vecteurs 
a(a,, æ,) et b(B,, B,) on a une seule condition 


œ 
B, B;, 


de leur colinéarité (les deux autres déterminants sont nuls puisque A; = 
= B, = 0). 

8. Aire d’un parallélogramme. Etant donné dans l’espace deux vecteurs 
non colinéaires a et b d’origine commune, l’aire du parallélogramme cons- 
truit sur ces vecteurs s’exprime en fonction de leurs composantes par rap- 
port à la base orthonormée suivant la formule 


S = l[a,b]l = 


— CA B; ES æ; B,Y + (@, B, ns œ; B,Ÿ + (æ, B; 7 œ; BY. (14) 


En géométrie plane, l’aire d’un parallélogramme se calcule de façon 
analogue. Bien que le produit vectoriel ne soit pas défini, on peut, comme 
dans la démonstration de la proposition 10, admettre que le plan étudié est 
placé dans l’espace et que pour troisième vecteur de base est choisi un vec- 
teur de longueur unité perpendiculaire à ce plan. Dans ce cas, le produit 
vectoriel de deux vecteurs dans le plan n’a qu’une composante différente de 
zéro, à savoir la troisième, et l’aire du parallélogramme construit sur les 
vecteurs a et b s'exprime au moyen de leurs composantes, par rapport à la 
base orthonormée du plan, par la formule 


S$ = læ, 8, — a, B,1, (15) 


autrement dit, est égale à la valeur absolue du déterminant 


= 0 


%j % 
5, B; 


Quand on écrit l'expression «8, — aæ,B,, il est essentiel d’avoir en vue l'ordre des vec- 
teurs, c'est-à-dire que a est le premier et b est le second. Si a était le second et b le premier, la 
composante du produit vectoriel serait 8,a, — B,a,. L'aire du parallélogramme est indépen- 
dante de l'ordre des vecteurs, car elle est égale au module de cette expression. 

Introduisons maintenant la notion d'orientation du parallélogramme dans le plan. On 
supposera que le parallélogramme cest construit sur deux vecteurs, c'est-à-dire que ses deux 
côtés adjacents sont des vecteurs d'origine commune. 

DÉFINITION. Un parallélogramme est dit orienté si le couple de vecteurs sur lesquels il est 
construit est ordonné. L'orientation est dite positive si la plus petite rotation appliquant le 
premier vecteur sur le second s'effectue dans le sens inverse au mouvement des aiguilles d’une 
montre, et négative dans le cas contraire. 

On supposera que le parallélogramme construit sur les vecteurs de base ©, ct 6, (parallélo- 
gramme de base) est orienté positivement. On choisit pour e, le vecteur [e,, 6,] vu que dans 
l'espace une base est toujours directe. L'inégalité «, 8, — a,8, > 0 signifie que le vecteur 
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[a, D] est orienté de la même façon que [e,, e,] ct, partant, le parallélogramme construit sur 
les vecteurs à et b a aussi une orientation positive. 

On convient de représenter l'aire d’un parallélogramme orienté par un nombre affecté 
d’un signe : positif pour les parallélogrammes orientés positivement, et négatif pour les paral- 
lélogrammes orientés négativement. 

Comme le montrent les raisonnements précédents, si le parallélogramme de base est 
orienté positivement, le nombre «,B, — a;B, est égal à l'aire du parallélogramme orienté 
construit sur les vecteurs a(a,, æ,)et b(8, , B,). On peut aussi dire que l'orientation du paral- 
Ilclogramme construit sur les vecteurs a et b coïncide avec celle du parallélogramme de base si 
@,8, — &,l3, > O et qu'elle est contraire si a 8, — x, B, < 0. 


9. Volume d’un parallélépipède orienté. On supposera que le parallélépipède est construit 
sur trois vecteurs, c'est-à-dire que ses trois arêtes sont des vecteurs ayant une origine com- 
munc. 

DEFINITION. Un parallclépipéde est dit orienté si le triplet de vecteurs sur lesquels il est 
construit cest ordonné. L'orientation cest dite positive si le triplet est direct et négative dans le 
cas contraire. 

On admet que le volume d'un parallélépipéde orienté est positif si son orientation est 
positive, et négatif si clle est négative. La proposition 4 peut maintenant être formulée de la 
façon suivante. 


PROPOSITION 11. Le produit mixte de trois vecteurs non coplanaires est égal au volume 
d'un parallélépipède orienté construit sur ces vecteurs. 


10. Produit vectoriel double. L'expression [a, {b, C]] est appelée pro- 
duit vectoriel double des vecteurs a, b, c. Démontrons que 


[a, [b, c]] = (a, c)b — (a, b)c. (16) 
A cet effet, choisissons une base orthonormée {e,, e,, e,] de manière que le 
vecteur e, soit de même sens que a (c’est-à-dire que a = œe,,où a = lal). 


Notons (B,,8,, B,), (y; Y2; 73) et (A,, ,, A.) les coordonnées respectives 
des vecteurs b, c et [b, c]. Selon la formule (1) on a alors 


(a, c) b = «7, (8, e, + B,e, + B,e.) 


et 
(a, b) c = aB, (y, 8, + v, 8, + Y,e;). 


Cela permet de transformer le second membre de la formule (16) : 
a (ni 8 — B7)6, + a (r 83 — B17,)6, = — a, 6, + a, e;. 
D'autre part, de la formule (11) on déduit immédiatement que 
[a, [b, c]] = —-aA, e, + «A, e,, 
ce qui achève la démonstration. 


11. Base biorthogonale. DÉFINITION. Une base composée des vecteurs 


- terel  ,,._ (el ._ lee] 
RE 
(6,.8,.8,) (6,.8,.6,) (6,.e,,6,) 


est dite biorthogonale à la base ;e,, e,, e. |. 
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La proposition 7 implique que e*, e>, 8; sont non coplanaires et constituent de fait une 
base. 

Il n'est pas difficile de vérifier que toute base orthonormée se confond avec la base bior- 
thogonale. 

PROPOSITION 12. Si je”, >, e}; est la base biorthogonale à la base le,, 6,,6,|, les compo- 
santes d'un vecteur arbitraire à par rapport à le,, e., 6, | se calculent par les formules 


a, = (8,8/), a, = (8,8;), a, = (a, e}). 
En effet, en multipliant l'égalité à = «,6, + a,6, + «,0, scalairement par e’, on 
(e,, e,, 0,) 
(6,,6,,e.,) 


PROPOSITION 13. Si le’, e’, e;l est la base biorthogonale à ‘6,, @,, @,/, la base 
18;°,65°, 6%"; qui est biorthogonale à je’, e}, e;]| se confond avec |e,, e,, 6, |. 


obtient (a, e})= a, . De façon analogue on démontre les autres formules. 


Pour le démontrer, commençons par décomposer le vecteur e; suivant les vecteurs er, 
e>, e; en utilisant les formules de la proposition 12. Vu que les composantes de e? sont 
(1, 0, O), il vient 
(e/,e/°) = 1, (e}/,e;*) = (e7,e;°) = 0. 

En décomposant de façon analogue e; et 8; on obtient encore six égalités 
(e;,e;°) = 1, (e;,e;°) = (e;,e;°) = 0, 
(e;,e;°) = 1, (e;,e;°) = (e;,e;*) = 0. 

Or ces égalités signifient en vertu de la même proposition 12 que les composantes des vec- 
teurs e?*, 8e; * et e;° par rapport à la base je, e,, @,; sont respectivement égales à (1, 0, O), 


(0, 1, 0) et (0, 0, 1), c'est-à-dire que e’° =6,,6;° = 6,,8;° = @,. La proposition est démon- 
trée. 


12. A propos des grandeurs vectorielles. Dans les mathématiques appli- 
quées, on étudie souvent des grandeurs représentées par les vecteurs : for- 
ces, vitesses, moments de forces, etc. Chacune de ces grandeurs vectorielles 
peut être définie par une formule de dimensions. Sans entrer dans le vif du 
sujet, on énoncera seulement les règles formelles d’opérations sur ces for- 
mules. 

Du point de vue formel, la formule de dimensions de la grandeur est un 
monôme composé d’un ensemble de symboles. On multiplie et divise ces 
monômes suivant les règles habituelles des opérations algébriques sur les 
mônomes : 

1. On n’additionne les grandeurs vectorielles que si leurs formules de 
dimensions coïncident, la formule de dimensions de la somme étant celle de 
ses termes. 

2. En multipliant une grandeur vectorielle par une grandeur scalaire, on 
multiplie leurs formules de dimensions. 

3. La grandeur vectorielle et son module ont une même formule de 
dimensions. 

4. La formule de dimensions du produit scalaire (du produit vectoriel) 
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est égale au produit des formules de dimensions des facteurs, ce qui découle 
aisément de leurs définitions et de la règle précédente. 

Pour représenter une grandeur vectorielle sur le dessin on doit se mettre 
d’accord sur l'échelle à utiliser : combien d’unités de longueur (par exem- 
ple, de cm) il faut prendre pour représenter une unité de grandeur ayant la 
formule de dimensions donnée (par exemple, km, m/s, N). 

Si les facteurs du produit vectoriel sont mesurés en unités de longueur, 
le produit est mesuré en unités d’aire. Pour représenter les unités d’aire on 
choisit l’échelle de manière qu’une unité d°aire soit représentée par une 
unité linéaire. Dans ce cas, la longueur du produit vectoriel sera numéri- 
quement égale à l’aire du parallélogramme construit sur les facteurs. 

Etant donné que l’unité de longueur est choisie une fois pour toutes et 
ne varie pas, cette convention n’entraîne pas des contradictions. Mais le 
problème n’est pas aussi bénin qu'il paraît. C’est ainsi que deux mathéma- 
ticiens utilisant cette convention mais se servant d’unités de longueur diffé- 
rentes (un mathématicien français utilisant les centimètres et son collègue 
anglais, les pouces) dessineront, pour les mêmes vecteurs, des produits vec- 
toriels qui ne coïncideront pas. 


$ 4. Changement de base et de repère 


1. Changement de base. Jusqu'à présent nous avons supposé qu'il exis- 
tait une seule base. Mais rien ne limite le choix d’une base, et un problème 
important se présente : rechercher les composantes d’un vecteur par rap- 
port à une base donnée à partir de ses composantes dans une autre base. 
Ceci étant, on doit préciser la position de la nouvelle base par rapport à 
l’ancienne, à savoir, on doit donner les composantes des nouveaux vecteurs 
de base 6, ,e,,@, par rapport à l’ancienne base {e,, 6,, e,}. Soit *) 


— h! 2 3 
e, = aile, + ae, + a; e,, (1) 
= hp! 2 3 


Décomposons un vecteur arbitraire a suivant les vecteurs €, , 6, , €, : 
a = à, 0, + à, 6, + a, ©;. * 


Notons &,, æ, et æ, les composantes du vecteur a par rapport à l’ancienne 
base. En décomposant chaque terme de l’égalité précédente suivant les vec- 


*) Pour commodité, un des indices est placé en haut. Ce n'est pas un exposant. Par exem- 
ple, a, se lit « a un-trois ». 
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teurs 6,, 6,, 6, on obtient en vertu des propositions 4 et 3 du $ 1 : 
Er 2: 1," 
, ° ee ° 
a, = aa) + dia; + aa, (2) 
RS D je 3," 


Les relations (2) définissent la solution du problème posé. Si on a besoin 
d’exprimer les nouvelles composantes en fonction des composantes ancien- 
nes, il faudra résoudre le système d'équations (2) par rapport aux incon- 
nues @,,@;,@. 

De la même façon, on peut obtenir les formules liant les composantes 
d’un vecteur par rapport à différentes bases du plan. Ces formules sont : 
a, =aa, +ala,, 0’) 
a, = aa; + a @;. 


Les coefficients associés à a, , æ, et æ,; dans les formules (2) peuvent être 
écrits sous la forme d’une matrice d’ordre 3 : 


ni ol pi 
a; 4; 4; 

2 2 p2 

3 43 n3 

a) 4; 4; 


Cette matrice porte le nom de matrice de passage de la base [e,, e., e,] à 
la base {e,, e,, e,]. Dans ses colonnes se trouvent les composantes des 
nouveaux vecteurs de base 6,, @, et 6, rapportés à l’ancienne base 
(e,,e,,e,|. 


2. Changement de repère. Considérons maintenant deux repères carté- 
siens : l’ancien [O, 6,, 6,, e,} et le nouveau {O', e,,8,, e, |. Soit M un 
point quelconque dont les coordonnées par rapport à ces repères sont 
notées respectivement (x, y, z) et (x°, y’, z'). On se propose d’exprimer 
x, y, zen fonction de x°, y’,z° en supposant connue la position du nou- 
veau repère par rapport à l’ancien, autrement dit connues les anciennes 
coordonnées a}, ai, a de la nouvelle origine O”, et les composantes des 
nouveaux vecteurs de base par rapport à l’ancienne base, qui constituent la 
matrice de passage (3). 

Les rayons vecteurs du point M relativement aux points © et O° sont 
liés par l'égalité OM = 00’ + OM qu'on peut écrire sous la forme 

OM = OO’ +x'e; +y'e; +27°e;, (4) 
vu que x’, y’, z' sont les composantes de OM par rapport à la base 
(e,, e,, 8,}. Décomposons chaque terme de l’égalité (4) suivant les vec- 


teurs 6,, 6,, 6,, compte tenu du fait que les composantes de OM et de OO” 
sont égales aux coordonnées des points M et O”, notées respectivement 
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x, y, z et a, aÿ, aÿ. On obtient trois égalités numériques équivalentes à 
l’égalité (4) : 

x= aix" +a)y" + alz" + a, 

y = ax" + ay" + az" + af, (5) 


z= aix" + ay" + az + ai. 
Les égalités (5) déterminent justement la transformation des coordonnées 
d’un point lors du passage d’un repère cartésien à l’autre. 

3. Transformation d’un repère cartésien rectangulaire dans le plan. 
Dans le plan, les formules de passage d’un repère à un autre peuvent être 
obtenues à partir de (5) si l’on y conserve les deux premières égalités en 
omettant les termes contenant z : 


lx°+aly"+a! 
aix +a} ru] 
2x + a2y° + a2 
afx +aiy + af. 


X 


} 
Considérons un cas particulier de deux repères cartésiens rectangulaires. 


(6) 


Fig. 14. Deux cas de position relative de deux bases orthonormées dans le plan 


Désignons par # l’angle des vecteurs e, et 6e, mesuré dans le sens de la plus 
petite rotation amenant 6, sur @,. Alors (fig. 14) on a 


e, = cos pe, + sin pe,, 


: LS . LI 
@, = cos (e + se + sin (e + se. 


On met le signe plus dans la décomposition de 6, si la plus petite rotation 
dee, à 6, est de même sens que celle de e, à @,, autrement dit si la nouvelle 
base est obtenue de l’ancienne par rotation d’angle w. On met le signe 
moins dans la décomposition de 6e; si au contraire la nouvelle base ne peut 
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être obtenue par rotation de l’ancienne. Vu que 


L d ë : À 
cos (e +2) = Fsing, sin (e +2) = +COS Y, 
on en déduit 
nd 
y =x"sinp + y'cosp + aë, 


où l’on prend le signe supérieur si la rotation du repère est possible. 
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CHAPITRE Il 


DROITES ET PLANS 


$ 1. Notions générales sur les équations 


1. Définition. Soient un repère et un ensemble S rapporté à ce repère. 
Par équation de l’ensemble S on entend une expression qui définit S au 
moyen des coordonnées de ses points, c’est-à-dire une assertion qui est 
vraie pour les coordonnées des points appartenant à S, et qui est fausse 
pour les coordonnées des points qui ne lui appartiennent pas. 

En géométrie plane, une équation d’un ensemble de points se présente 
souvent sous la forme F(x, y) = 0, où Fest une fonction de deux variables, 
et en géométrie dans l’espace, sous la forme F(x, y, z) = 0 où Fest une 
fonction de trois variables. 

En etudiant les mathématiques, on fait connaissance avec des règles 
logiques et mathématiques qui permettent de passer d’une assertion vraie à 
l’autre. L’étude rigoureuse de ces règles est du domaine d’une science spé- 
ciale, la logique mathématique. Quant à nous, en formulant les proposi- 
tions qui suivront on admettra que ces règles sont connues au lecteur. Il est 
donc naturel qu’on s’abstienne de les démontrer. 


PROPOSITION 1. Si P, et P. sont les équations des ensembles S et T, 
l'équation de leur intersection S NT est une assertion affirmant que P. et 
P; sont vraies en même temps. 

Soient P. et P, deux égalités contenant les coordonnées d'un point : 
F{x, 7,1) = 0er F;(x, y, 7) = 0. Alors l'équation de l'intersection est un 
Système d'équations : 


F(x, 7,7) = 0, F;(x, 7,2) = 0. 


PROPOSITION 2. Si P, et P; sont les équations des ensembles S et T, 
l'équation de leur réunion S LU T est une assertion affirmant que de P. et 
P. l'une au moins est vraie. 

Si P, et P- sont de la forme F(x, y, z) = Oet F,;{x, y, z) = 0, l'équa- 
tion de la réunion peut être écrite sous la forme 


F(x, y, 2) F,(x, y, 7) = 0. 
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PROPOSITION 3. Si P, et P. sont les équations des ensembles S et T, et S 
est un sous-ensemble de T, P. implique P... 


PROPOSITION 4. Les ensembles S et T se confondent si et seulement si 
leurs équations sont équivalentes, c'est-à-dire si P, implique P,, et P- 
implique P.. 

Parfois les propositions 3 et 4 sont considérées comme les définitions 
des relations « implication » et « équivalence » entre les équations. 


2. Courbes et surfaces algébriques. L'étude d’ensembles de points quel- 
conques est un domaine immense. On définira ici une classe d’ensembles 
relativement étroite mais toutefois beaucoup trop large pour être étudiée de 
façon détaillée. 

DÉFINITION. On appelle surface algébrique un ensemble qui dans un 
repère cartésien peut être défini par une équation de la forme 


A, xki ph +... + A xs yhzms = 0, (1) 


où tous les exposants sont des entiers positifs. La plus grande des 
sommes *) &K, +/, + m,,..….,k. + L + m,est appelée degré de l'équation 
ou ordre de la surface algébrique. 


DÉFINITION. On appelle courbe algébrique plane un ensemble qui dans 
un repère cartésien du plan peut être défini par une équation de la forme 


A, x ph +... + A x ph = 0, (2) 


tous les exposants étant des entiers positifs. La plus grande des sommes 
k, +1,,...,k, + L est appelée degré de l'équation ou ordre de la courbe. 
On voit sans peine qu’une surface algébrique n’est pas obligatoire- 
ment telle qu'on se la représente intuitivement. Par exemple, l'équation 
X? + y? + z2 + 1 = 0 n’est vérifiée par les coordonnées d'aucun point. 
L’équation 
x? + y? + 27) [x — IP + (y — 1P + (z — 1}] = 0 


définit deux points, l'équation y? + z? = 0 définit une droite (l’axe des 
abscisses). La même remarque concerne les courbes algébriques. Le lecteur 
trouvera lui-même des exemples appropriés. 

Les définitions données possèdent un important défaut. A savoir, on 
ignore la forme que prend l’équation de la surface dans un autre repère car- 
tésien. Même si dans un autre repère cartésien une équation présente la 
forme (1), lequel des degrés de ces équations doit être appelé ordre de la 


*) 11 s’agit évidemment de la plus grande somme figurant dans l'équation, c'est-à-dire 
qu'on suppose qu'après avoir réduit les termes semblables il existe au moins un terme de cocf- 
ficient non nul possédant une telle somme d'exposants. La même remarque se rapporte à la 
définition de l'ordre de la courbe algébrique, donnée plus bas. 
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surface. Des questions analogues se posent aussi pour des courbes algébri- 
ques. La réponse nous est fournie par les théorèmes suivants appelés théo- 
rèmes d'invariance de l'ordre. 


THÉORÈME 1. Toute surface définie par une équation de la forme (1) dans 
un repère cartésien l'est aussi dans tout autre repère cartésien, le degré de 
l'équation restant le même. 


THÉORÈME 2. Toute courbe du plan définie par une équation de la forme 
(2) dans un repère cartésien l’est aussi dans tout autre repère cartésien, le 
degré de l'équation restant le même. 


Les deux théorèmes se démontrent de la même façon. Démontrons par 
exemple le théorème 2. Passons du repère cartésien {O, 6,, e,i dont il 
s'agissait dans la définition à un nouveau repère cartésien quelconque 
[0°,e,,6, |. Les anciennes coordonnées x, y sont liées aux nouvelles x”, y” 
par les formules (6) du $ 4, ch. I : 


x 
y 


Pour obtenir l’équation de la courbe dans le nouveau repère, portons dans 
son équation les expressions de x et y en fonction de x ‘et y‘. En élevant le 
trinôme a/x° + aly° + al à la puissance £ on obtient un polynôme en x” 
et y” de degré k. En élevant a?x° + a?y° + aÿ à la puissance / on obtient 
un polynôme de degré /. En multipliant les polynômes obtenus on remar- 
que que chaque terme de la forme Ax# y! figurant dans le premier membre 
de l’équation (2) devient un polynôme de degré k + / en x° et y’. La 
somme des polynômes est un polynôme dont le degré est au plus égal aux 
degrés de ses termes. (Il aurait pu être strictement inférieur si les termes de 
plus haut degré étaient supprimés.) On vient ainsi de démontrer que dans 
tout repère cartésien la courbe algébrique se définit par une équation de la 
forme (2) et que le degré de cette équation ne peut augmenter avec le pas- 
sage d’un repère à un autre. Il nous reste à démontrer qu’il ne peut dimi- 
nuer non plus et, par suite, doit rester constant. On le démontre aisément 
par l’absurde. En effet, avec le passage inverse du repère [O”, 6, ,e; | au 
repère | O, 6,, 8,}, les anciennes coordonnées x”, y” d’un point s’expriment 
en fonction de ses nouvelles coordonnées x, y au moyen des formules ana- 
logues à celles données ci-dessus. Si, avec le passage de {O, e,, e,] à 
[0",6,,e; }, le polynôme F(x, y) se transformait en polynôme G(x, y"), 
le passage inverse convertit le polynôme G(x”,y')en F(x, y). Supposons 
maintenant qu’au cours du passage du repère [O, 6,, e,} au repère 
(0”,e6,,e; ]le degré de l’équation diminue. Alors, avec le passage inverse 
de (0”,6,,6; | à {O, e.,, e,), le degré aurait dû augmenter, ce qui, comme 
on le sait, est impossible. 


aix" +a)y +a, 


aix" + ai} + a. 
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REMARQUE. La propriété d’invariance de l’ordre ne se rapporte pas aux 
différentes équations qu’une courbe ou une surface peut avoir dans un 
même repère. Bien que ces équations soient équivalentes, il existe parmi 
elles des équations de différents degrés et même de formes autres que (1) ou 
(2). En effet, les trois équations suivantes définissent le cercle de rayon 1 et 
de centre à l’origine du repère cartésien rectangulaire : 


Vx?+y2=1, x2+y2—-1=0, (x?+y?- 1} = 0. (3) 


On admet que les équations équivalentes de forme (2) et de degrés diffé- 
rents définissent des courbes algébriques différentes (bien que les ensem- 
bles de points qui les vérifient se confondent). Par exemple, on dit que la 
dernière équation (3) définit un « cercle double ». 

L'ordre d’une courbe algébrique est le premier exemple d’invariant ren- 
contré. D'une façon générale, on appelle invariant toute grandeur qui ne 
varie pas avec le changement de repère. Seules les combinaisons invariantes 
de grandeurs (de coefficients, d’exposants, etc.) intervenant dans l’équa- 
tion d’une courbe ou d’une surface caractérisent les propriétés géométri- 
ques de la courbe ou de la surface indépendamment de leur position par 
rapport au repère. Quant à l'interprétation géométrique de l’ordre de la 
courbe, elle sera éclaircie à la fin de ce chapitre. 

On est en mesure maintenant de préciser l’objet principal du cours de 
géométrie analytique. On y groupe essentiellement des courbes et des surfa- 
ces algébriques d’ordre 1 et 2 se prêtant à l’étude par les procédés de l’algé- 
bre élémentaire. 

Avant d’aborder leurs propriétés, passons en revue quelques équations 
plus générales. On aura affaire à des courbes et des surfaces. La formula- 
tion de leurs définitions générales n’entre pas dans le cadre de cet ouvrage. 
Le lecteur habitué aux définitions strictes peut entendre par courbe et sur- 
face respectivement une courbe algébrique et une surface algébrique, toute- 
fois tous les résultats s'appliquent également au cas plus général. 


3. Equations paramétriques des courbes. Supposons que la courbe est 
la trajectoire d’un point qui se déplace. A chaque instant { nous connais- 
sons la position du point, autrement dit, ses coordonnées par rapport à un 
repère préalablement choisi. Cela signifie que les coordonnées (x, y, z) (ou 
(x, y) pour une courbe plane) sont des fonctions données du temps : 


x=@p(t), y= VC), z= x(4). (4) 


Le fait que la variable r a ici le sens physique de temps n’est pas essentiel. Si 
l’on définit les coordonnées du point comme une fonction d’une variable 
quelconque ou, comme on dit, d’un paramètre, on définit par là même une 
courbe. 
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Les équations de la forme (4) sont appelées équations paramétriques 
d'une courbe dans l’espace, tandis que les équations de la forme x = w(t), 
y = ÿ(t), équations paramétriques d’une courbe dans le plan. Rappelons 
que l’équation de la courbe est une assertion sur les coordonnées des points 
qui n’est vraie que pour les points de la courbe. Dans le cas considéré, 
l’énoncé complet de cette assertion est le suivant : il existe un nombre f qui 
vérifie les égalités (4). 

Par exemple, les équations x = r cos f, y = r sin t{ définissent le cercle 
de rayon r et de centre à l’origine des coordonnées. On s’en assure aisément 
si l’on remarque que ! est l’angle entre le rayon vecteur d’un point du cercle 
et le vecteur de base e.. 

Les équations x = r cos {, y = r sin f{,z = at définissent ung hélice 
située sur le cylindre de rayon 7, dont le pas vaut 2xa. 


4. Equations paramétriques des surfaces. Cônes. Par analogie avec les 
équations paramétriques d’une courbe introduisons les équations paramé- 
triques d’une surface. Les équations de la forme 


x= (uv), y=vV(u,u), z=x(u,v) (S) 


sont appelées équations paramétriques d'une surface si à chaque point M 
de la surface correspond un couple de nombres (4, vu) pour lequel les coor- 
données de M s'obtiennent à partir de ces équations, et inversement, pour 
les points ne se trouvant pas sur la surface il n’existe pas de tel couple de 
nombres. 

Cherchons à titre d'exemple les équations paramétriques d’un cône. On 
appelle surface conique ou cône une surface engendrée par des droites pas- 
sant par un point fixe appelé sommet du cône. Les droites sont dénommées 
génératrices (fig. 15), quant à la courbe de la surface ne passant pas par le 
sommet et rencontrant toutes les génératrices, elle porte le nom de direc- 
trice du cône. 


Fig. 15. 4 — directrice. MP — génératrice 
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Soient donnés le repère cartésien dont l’origine coïncide avec le sommet 
O du cône et les équations paramétriques de la directrice x = f(u), y = 
= g(u),z = h(u). Passant par un point arbitraire M(x, y, z) du cône, la 
génératrice coupe la directrice en un point P de coordonnées f(u), g(u), 
h(u), où u est la valeur correspondante du paramètre. Les vecteurs OM et 
OP étant colinéaires, il existe un nombre v tel que OM = vOP,. Ecrivant 
cette égalité en coordonnées, on exprime les coordonnées d’un point arbi- 
traire du cône en fonction des paramètres u et v : 


x = vf(u), 
y = vg(u), 
z = vh(u). 


On laisse au lecteur le soin de vérifier qu'aucun point extérieur au cône ne 
vérifie ces équations, quels que soient u et v. 


5. Equations où l’une des coordonnées est absente. Considérons un cas 
particulier quand l’équation de la surface ne contient pas l’une des coor- 
données, par exemple z, et par suite, prend la forme G(x, y) = 0. Suppo- 
sons que le point M, de coordonnées x,, y,, 4 Se trouve sur la surface. 
Dans ce cas tout point de coordonnées x,, y,, z (où z est quelconque) 
appartient également à la surface. On voit sans peine que ces points engen- 
drent une droite passant par le point M, en direction du vecteur 6,. Donc, à 
tout point M, correspond sur la surface une droite passant par M, en direc- 
tion de e,. 

DÉFINITION. La surface constituée des droites parallèles à une direction 
donnée est appelée surface cylindrique ou cylindre et les droites, ses généra- 
trices (fig. 16). La courbe de la surface rencontrant toutes les génératrices 
est dénommée directrice. 
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M{xo, Yo. 2} 


Fig. 16. L — directrice, MM — gencrairice 


On a montré que l'équation, dans laquelle l’une des coordonnées est 
absente, définit un cylindre dont les génératrices sont parallèles à l’axe des 


coordonnées correspondant. 
4* 
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A titre d'exemple on recommande au lecteur de construire une surface 
définie dans un repère cartésien rectangulaire de l’espace par l’équation 
x? + y? = rè. Cette surface est un cylindre circulaire droit. 


$ 2. Equations de la droite et du plan 


Ce paragraphe ainsi que le suivant sont consacrés aux équations du 
plan, de la droite dans le plan et dans l’espace. Ces équations ont beaucoup 
de commun et on les étudiera ensemble. Au cas où les propositions sembla- 
bles admettent les mêmes démonstrations on n’en donnera qu’une seule. 


1. Surfaces et courbes du premier ordre. L’équation du premier degré, 
ou équation linéaire, liant les coordonnées d’un point dans l’espace est de 
la forme 


Ax + By+Cz+D=0, (1) 


où tous les coefficients ne sont pas nuls en même temps, c'est-à-dire 4? + 
+ B? + C? # 0. De façon analogue, l’équation du premier degré, ou équa- 
tion linéaire, liant les coordonnées d’un point dans le plan est l’équation 


Ax + By+C=0, (2) 


à la condition que 4? + B? + O0. 
On démontre que les surfaces et les courbes du premier ordre sont des 
plans et des droites. Plus précisément, on a les théorèmes suivants. 


THÉORÈME 1. Etant donné un repère cartésien de l'espace, à tout plan on 
peut associer une équation linéaire, et inversement, toute équation linéaire 
(1) définit un plan. 


THÉORÈME 2. Etant donné un repère cartésien du plan, à toute droite on 
peut associer une équation linéaire, et inversement, toute équation linéaire 
(2) définit une droite. 

Les deux théorèmes se démontrent de façon analogue. Démontrons, 
par exemple, le théorème 1. 

Soit donné un plan. Choisissons un repère dont l’origine et les deux pre- 
miers vecteurs de base e, et &, sont situés dans le plan donné, tandis que le 
vecteur 6, est arbitraire. Rapporté à ce repère, le plan a pour équation z = 

= 0 qui est une équation linéaire. En vertu du théorème d’invariance de 
l’ordre, ce plan est aussi défini par une équation linéaire dans tout autre 
repère cartésien. 

Inversement, soient donnés un repère cartésien quelconque et l’équa- 
tion (1). Cherchons l’ensemble des points dont les coordonnées vérifient 
cette équation. Supposons pour fixer les idées que dans l'équation le coeffi- 
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cient C n’est pas nul et procédons au changement de repère en posant 
X°=X, y =}, z°= Ax + By + Cz + D. (3) 


Défini dans l’ancien repère par l’équation (1), l’ensemble cherché a pour 
équation z' = 0 dans le nouveau repère et, par suite, est un plan. Il nous 
reste à démontrer que les équations (3) définissent en effet le passage à un 
nouveau repère. Résolvons-les par rapport à x, y et z. Il vient 
X=X, Y=y", Zz= RP 
EC C C C 

En s'appuyant sur les formules (5) du $ 4, ch. I, on peut affirmer que ces 
égalités définissent le passage du repère initial au repère (0, 8,,e;,6,], 
avec O'‘(0, 0, —-D/C), e, (1,0, —- 4/C), 6, (0, 1, — B/C), e, (0, 0, 1/C). 
Les composantes des vecteurs @,, 8, et @, montrent que ces vecteurs ne 
sont pas coplanaires, quelles que soient les valeurs de 4, B et C. La 
démonstration est ainsi achevée. 

Les théorèmes 1 et 2 donnent une réponse exhaustive au problème des 
équations du plan et de la droite dans le plan. Mais, vu l’importance de ces 
équations, on en cherchera d’autres formes. 


2. Equations paramétriques de la droite et du plan. Une droite (dans le 
plan ou dans l’espace) est complètement définie par l’un de ses points et par 
un vecteur non nul parallèle à cette droite. Il va de soi que le choix du point 
et du vecteur peut être effectué de nombreuses façons, mais en attendant 
on admettra qu'ils ont été choisis d’une certaine manière et on les appellera 
point initial et vecteur directeur de la droite. De façon analogue, un plan 
est défini par un point et deux vecteurs non colinéaires situés dans ce plan, 
appelés point initial et vecteurs directeurs du plan. 

On admettra qu'est donné un repère cartésien dans l’espace ou dans le 
plan (si l’on étudie la droite en géométrie plane). Cela signifie en particulier 
qu’à chaque point on fait correspondre son rayon vecteur issu de l’origine 
des coordonnées. 

Soit une droite. Notons r, et a respectivement le rayon vecteur de son 
point initial M, et le vecteur directeur de la droite. Considérons maintenant 
un point quelconque M et désignons par r son rayon vecteur (fig. 17). Le 
vecteur r — fr, dont l’origine M, se trouve sur la droite est parallèle à la 
droite si et seulement si son extrémité, le point AZ, est aussi située sur la 
droite. Dans ce cas et seulement dans ce cas, il existe pour le point M un 
nombre ! tel que 

r-r =1a. (4) 


Inversement, quel que soit le nombre £ dans la formule (4), le vecteur rest le 
rayon vecteur d’un point qui appartient à la droite 
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Fig. 17. 


Dans la formule (4), la variable parcourant toutes les valeurs réelles est 
appelée paramètre, et l'équation (4) équation paramétrique vectorielle de la 
droite. 

L’équation paramétrique vectorielle de la droite est de la même forme 
en géométrie plane et dans l’espace mais, décomposée suivant les vecteurs 
de base, elle se réduit dans le premier cas à deux et dans le second cas à trois 
équations scalaires. En effet, désignons les coordonnées des points Met M, 
par (x, y) et (x,, yo) si l’on étudie une droite dans le plan et par (x, y, z) et 
(X5> Yo» 2) Si la droite est dans l’espace. Notons respectivement (a,, a.) et 
(a,, a,, a,) les composantes du vecteur a et décomposons les deux membres 
de l’égalité (4) suivant les vecteurs de base. Il vient 


X— X) = 4, 
(5) 
-Y=@t 
ou 
X—-X) =at, 
Y—- Yo = Bt, (6) 
Z—-TL=Aat 


suivant le nombre de vecteurs composant la base. Les équations (5) sont 
appelées équations paramétriques de la droite dans le plan et les équations 
(6), équations paramétriques de la droite dans l'espace. 

Cherchons maintenant les équations paramétriques du plan. Notons r,, 
p et q le rayon vecteur du point initial M, et les vecteurs directeurs du plan. 
Soit dans l’espace un point arbitraire M de rayon vecteur r. L'origine du 
vecteur Fr — Fr, est dans le plan. Donc, son extrémité Mest dans le plan si et 
seulement si ce vecteur se trouve dans le plan considéré. Les vecteurs P et q 
ne sont pas colinéaires (fig. 18). Par conséquent, si (et seulement si) le 
point M est dans le plan, il existe des nombres r, et £, tels que 


r-n=tPpP+29. (7) 
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Fig. 18. 


Cette équation porte le nom d’équation paramétrique vectorielle du plan. 
A tout point du plan correspondent deux valeurs des paramètres , et £,. 
Inversement, quelles que soient les valeurs des paramètres f, et r,, l’équa- 
tion (7) définit le rayon vecteur d’un point dans le plan. 

Si (x, y, z) et (xo, Jos 20) Sont les coordonnées des points M et M,, et 
(P,, P;, P;) et (q,, 42, q,) les composantes des vecteurs p et q, en décompo- 
sant les deux membres de l'égalité (7) suivant les vecteurs de base, on 
obtient 


X—X = hp +4, 
Y — Yo = li P3 + LG; (8) 
ZT hP;+ttq. 


Les équations (8) sont appelées équations paramétriques du plan. 

Signalons que le point initial et le vecteur directeur de la droite consti- 
tuent sur cette droite son propre repère cartésien. La valeur du paramètre f 
correspondant à un point quelconque de la droite est la coordonnée de ce 
point par rapport à ce repère. 

Une remarque analogue peut être faite pour le plan. Son point initial et 
les vecteurs directeurs y constituent son propre repère. Les valeurs des 
paramètres /, et £, correspondant à un point quelconque du plan sont les 
coordonnées de ce point par rapport à ce repère. 

Etudions le passage des équations linéaires générales du plan et de la 
droite dans le plan à leurs équations paramétriques. Le point initial 
s'obtient aisément : si dans l’équation (1) du plan le coefficient À, par 
exemple, est différent de zéro, posons y, = z, = 0et cherchons x, à partir 
de l'équation. On obtient ainsi le point M, (— D/AÀ, 0, 0) dont les coordon- 
nées vérifient l’équation (1), et qu’on peut prendre pour point initial. Pour 
une droite du plan les coordonnées du point initial se définissent de façon 
analogue. 

Montrons maintenant comment trouver les vecteurs directeurs. Suppo- 
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sons qu’une droite du plan est définie par son équation générale Ax + 
+ By + C = 0 dans un repère cartésien quelconque et que (x, y,) sont les 
coordonnées d’un point M, de la droite. En retranchant l'égalité Ax, + 
+ By, + C = 0 de l'équation de la droite, on obtient 


A(Xx — x) + B(y — y,) = 0. 


Considérons maintenant le vecteur de composantes (x — x,, y — y,). Son 
origine M, se trouve sur la droite et, par suite, il est parallèle à la droite si et 
seulement si son extrémité, le point M de coordonnées (x, y), se trouve sur 
la droite, et si l'équation précédente est vérifiée. En désignant les compo- 
santes du vecteur M,M par «, et æ,, on peut énoncer la proposition qui 
suit. 


PROPOSITION 1. Tout vecteur non nul dont les composantes a, et æ, véri- 
Jient l'équation Aa, + Ba, = 0 peut être pris pour le vecteur directeur de 
la droite Ax + Bx + C = 0. En particulier, le vecteur de composantes 
(— B, À) est un vecteur directeur. 

De façon analogue on démontre la proposition suivante : 


PRoPosITion 2. Tout couple de vecteurs non colinéaires dont les compo- 
santes vérifient l'équation Aa, + Ba, + Ca, = 0 peut être pris pour les 
vecteurs directeurs du plan dont l'équation générale dans un repère carté- 
sien est Ax + By + Cz + D = 0. 


3. Elimination d’un paramètre entre les équations paramétriques de la 
droite. Considérons dans le plan une droite définie par les équations para- 
métriques (5). Vu que le vecteur directeur n’est pas nul, l’une au moins de 
ses composantes a, , a, est différente de zéro. 

Supposons d’abord que a, # 0. Dans ce cas, on obtient de la première 
équation que { = (x — x,)/a,. Portant ! dans la seconde équation on a 


a, 
de (X — x), 
] 


"y =Kkx + b, (9) 


ou 


avec k = a,/a, et b = y, — a,x,/a,. L’équation (9) est l'équation de la 
droite résolue en ordonnée. On peut aussi l’obtenir en résolvant l’équation 
AXx + By + C = Oen y. 


DÉFINITION. On appelle coefficient angulaire de la droite le rapport a, /a, 
des composantes du vecteur directeur. 

Posant x = 0 dans l’équation (9), on obtient y = b. Cela signifie que le 
point de coordonnées (0, b) se trouve sur la droite (fig. 19). C’est le point 
d’intersection de la droite avec l’axe des ordonnées. Tout ce qui vient d’être 
dit peut être resumé dans la 
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Fig. 19. 


PROPOSITION 3. Si la droite n'est pas parallèle à l'axe des ordonnées 
(a, # 0), son équation peut être écrite sous la forme (9), où Kk est le coeffi- 
cient angulaire, et b l’ordonnée du point d'intersection de la droite avec 
l’axe des ordonnées. 


Considérons une équation résolue en ordonnée dans le repère cartésien 
rectangulaire. Dans cette équation, le terme b est égal en valeur absolue à la 
distance de l’origine des coordonnées au point d’intersection de la droite 
avec l’axe des ordonnées ; b est strictement positif si ce point se trouve du 
même côté de l’origine des coordonnées que l'extrémité du vecteur e, ; dans 
le cas contraire, b est strictement négatif. 

Le coefficient angulaire de la droite rapportée à un repère cartésien rec- 
tangulaire est égal à la tangente de l’angle que forme cette droite avec l’axe 
des abscisses. Cet angle est mesuré à partir de l’axe des abscisses dans le 
sens de la plus petite rotation amenant l’axe des abscisses sur celui des 
ordonnées (fig. 20). 


Fig. 20. 


PROPOSITION 4. Si la droite est parallèle à l’axe des ordonnées (a, = 0), 
son équation est de la forme x = x,, où x, est l’abscisse du point d'intersec- 
tion de la droite avec l’axe des abscisses. 
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Pour le démontrer, il suffit de porter a, = 0 dans les équations (5). La 
première de ces équations prend alors la forme x = x,, et la seconde se 
réduit à l’assertion que y est arbitraire. Autrement dit, la droite est consti- 
tuée des points de coordonnées (x,, y) où y parcourt toutes les valeurs pos- 
sibles. 

Chassons maintenant le paramètre f des équations parametriques (6) de 
la droite dans l’espace. Posons d’abord qu'aucune des composantes du 
vecteur directeur n’est nulle. Alors 

{ = 2 7 X { = Y t = Z27 à 


a, a; a; 
d’où l’on obtient deux egalités 


20-7207 9 (10) 
a, a; a; 
que vérifient les coordonnées de tout point de la droite et ne vérifient les 
coordonnées d’aucun point non situé sur la droite. Vu que toute droite 
dans l’espace peut être représentée, en accord avec la proposition 1 du $ 1, 
comme une droite d’intersection de deux plans, elle se définit bien par un 
système de deux équations linéaires. 
Si l’une des composantes du vecteur directeur, par exemple a,, devient 
nulle, l'équation de la droite prend la forme | 


x=., = à (10°) 
a; a, 
Cette droite se trouve dans le plan x = x; et, par suite, est parallèle au plan 
x = 0. Le lecteur écrira aisément l’équation de la droite si s’annulle non pas 
a, mais une autre composante. 
Lorsque deux composantes du vecteur directeur sont nulles, par exem- 
ple a, et a,, la droite a pour équation 


X= Xp } = Jo: (10°) 


Cette droite est parallèle à l’un des axes de coordonnées, dans notre cas à 
l’axe des cotes. 

On représente souvent l’équation d’une droite sous la forme (10) en 
posant le numérateur égal à zéro si le dénominateur s’annule. 


4. Equations vectorielles du plan et de la droite. Le plan est entièrement 
défini par son point initial et par un vecteur non nul n perpendiculaire au 
plan, appelé vecteur normal. Si r est le rayon vecteur d’un point du plan, 
r— r, se trouve dans le plan et, par suite, 


(r—r,n) = 0. (11) 
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Inversement, on voit aisément que le point de rayon vecteur r appartient au 
plan si r vérifie (11). L'égalité (11) sera appelée équation vectorielle du 
plan. | | 

Si p et q sont des vecteurs directeurs du plan, le vecteur [p, q] est un 
vecteur normal. On aboutit ainsi à l’équation vectorielle de la forme 


(r—r,,p, q) = 0. (11°) 

On peut aussi donner à l’équation vectorielle du plan la forme 
(r,n) + D = 0, (12) 
où D = —(r,, n). Cette équation ne renferme pas de rayon vecteur du 


point initial. 

PROPOSITIONS. Soient x, y, z les composantes du vecteur r par rapport à 
un repère cartésien donné. Le produit scalaire (r — r,,n), oùn + 0, s'écrit 
alors sous la forme du polynôme linéaire Ax + By + Cz + D, avec A? + 
+ B+C+#o0. 

Inversement, étant donné un repère cartésien, il existe pour tout poly- 
nôme linéaire des vecteurs tr, et n # 0 tels que Ax + By + Cz + D = 
= (r—-r,n). 

La première partie de la proposition est évidente. En effet, portons 
dans l’expression donnée le vecteur r décomposé suivant les vecteurs de 
base : 

(xe, + ye, + 78, - r,n) 


et chassens les parenthèses. On obtient le polynôme Ax + By + Cz + D 
dans lequel D = —(r,, n)et 


A={e,.n), B=(e,,n), C=(e,,n). (13) 


A, B, C ne sont pas simultanément nuls, car le vecteur non nul n ne peut 
être orthogonal à la fois à tous les vecteurs de base. 

Pour démontrer l’assertion inverse, proposons-nous d’abord de trouver 
le vecteur n à partir des égalités (13) en supposant 4, B et C donnés. Cher- 
chons ce vecteur sous la forme 


n = æ[e,, 0) + Be, e,] + yle,, e.). 


En multipliant scalairement cette égalité par 6, on obtient (6,, n) = 
= «(,,6,,6,). D'où « = 4/(6,,6,,6,). De façon analogue, on obtient B 
et y. Le vecteur n n’est pas nul, car [e,, e,], [e,, e,] et [e,, @,] sont linéai- 
rement indépendants (proposition 7, $ 3, ch. I) et «, B et y ne sont pas 
simultanément nuls, comme d’ailleurs À, B et C. 

Ainsi donc, on peut écrire le polynôme donné sous la forme 


x(e,,n) + y(e,,n) + z(e,,n) + D = (r,n) + D. 
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Le vecteur r, doit satisfaire à la condition —(r,, n) = D. Cherchons-le sous 
la former, = An. Après avoir fait la substitution on trouve — X(n, n) = D, 
d’où r, = —-Dn/lnli. 

Remarquons que la proposition démontrée entraîne aisément le théo- 
rème 1. En outre, comme corollaire on obtient la proposition suivante : 


PROPOSITION6. Si le repère cartésien est rectangulaire, le vecteur de com- 
posantes À, B et C est le vecteur normal du plan Ax + By + Cz + 
+ D = 0. 

Cela découle immédiatement des formules (13) en vertu de la proposi- 
ion 1 du $ 3, ch. I. 


Dans le cas d’un repère cartésien quelconque, À, 8, C sont les composantes du vecteur n 
suivant les vecteurs e”, e;, @; de la base biorthogonale à |e,, e,, e.. 


Tout ce qui a été dit plus haut sur le plan peut presque sans changement 
être dit de la droite dans le plan. Si r, est le rayon vecteur du point initial de 
la droite et n un vecteur non nul perpendiculaire à cette droite, l’équation 
de la droite dans le plan s’écrit sous la forme 


—-r,n)=0 ou (rn)+cC=0. 
En coordonnées, cette équation est de la forme Ax + By + C = 0, où 
A = (e,,n), B = (e,,n). 


PROPOSITION 7. Si le repère cartésien est rectangulaire, le vecteur de com- 
posantes (A, B) est perpendiculaire à la droite d'équation Ax + By + 
+ C=o0. 

Dans cette proposition, comme plus haut dans la proposition 6, il est 
très important que le repère soit supposé cartésien rectangulaire. Pour sou- 
ligner que cette condition est importante, il suffit de considérer la droite 
x + y = Oet le vecteur de composantes (1, 1) qui sont représentés sur la 
figure 21 dans le cas où les vecteurs de base sont de longueur différente. 


a(1,1) 
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Passons maintenant à l’équation vectorielle de la droite dans l’espace. 
Elle peut être écrite sous la forme 


{r— r,,a] = 0, (14) 


où à est le vecteur directeur de la droite et r, le rayon vecteur du point ini- 
tial de la droite. En effet, cette équation, comme l’équation paramétrique 
vectorielle de la droite, exprime la colinéarité des vecteurs Fr — Fr, et a. Si 
l’on désigne [r,, a] par d, on obtient l’équation vectorielle de la droite sans 
point initial : 

[r, a] = d. (15) 


Si la droite est définie par l’équation (15), on est en mesure de trouver le 
point initial sous la forme, par exemple, de r, = f{[a, d]. En portant r, dans 
(15) on obtient t{[a, d], a] = d, d’où, en vertu de la formule du produit 
vectoriel double, s{(a, a)d — (a, d)a} = d. Puisque (a, d) = O, il s’ensuit 
que : = (a, a)-'etr, = lal-2{a, d]. 

Remarquons que le point r, ainsi défini est le pied de la perpendiculaire 
abaissée de l’origine des coordonnées sur la droite, tandis que r = t[a, dl] 
est l’équation paramétrique de cette perpendiculaire. 


S. Conditions de parallélisme de deux plans et de deux droites dans un 
plan. La proposition 1 entraîne aisément la condition de parallélisme de 
deux droites dans un plan, imposée aux coefficients de leurs équations. La 
condition analogue pour les plans découle de la proposition 2 et des formu- 
les (13). Il faut toutefois avoir en vue que cette condition est satisfaite non 
seulement lorsque les équations définissent des droites parallèles différen- 
tes mais aussi dans le cas où les équations considérées définissent une même 
droite. Il est commode alors de dire que les droites définies par les équa- 
tions se confondent. 


PROPOSITION 8. 1) Deux droites définies dans un repère cartésien par les 
équations 
Ax + By+C=0, Ax+By+C =0 
sont parallèles si et seulement si les coefficients correspondants des varia- 


bles x et y dans leurs équations sont proportionnels, c'est-à-dire s’il existe 
un nombre X tel que 


A, = XA, B, = XB. (16) 
2) Les droites se confondent si et seulement si leurs équations sont pro- 


portionnelles, c'est-à-dire si avec l'égalité (16) on a (pour le même \) 
l'égalité 


C, = ÀC. (17) 
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DÉMONSTRATION. La première partie de la proposition découle immé- 
diatement du fait que les vecteurs de composantes (— B, 4) et (—B,, À;) 
sont des vecteurs directeurs des droites correspondantes. 

Démontrons la seconde partie. Dans les égalités (16) et (17), À ne peut 
être nul, vu que les coefficients de l’équation de la droite ne peuvent 
s’annuler simultanément. Par conséquent, si ces égalités sont vérifiées, les 
équations sont équivalentes et définissent une même droite. 

Vérifions la proposition réciproque. Si les droites sont parallèles, leurs 
équations, comme on l’a vu, doivent avoir la forme Ax + By + C = Oet 
ÀA(Ax + By) + C, = 0 pour un certain À. Si de plus un point de coordon- 
nées (x,, y,) appartient à deux droites, les égalités Ax, + By, + C = Oet 
ÀA(Ax, + By,) + C, = 0 sont aussi vérifiées. De ces égalités il résulte que 
C, = XC. La proposition est démontrée. 


PROPOSITIONS. Soient P et Q deux plans définis dans un repère cartésien 
par les équations 


Ax + By+Cz+D=0, Ajx+By+Cz+D=t. 


Pour qu'ils soient parallèles il faut ei il suffit qu'il existe un nombre X tel 
que 


A =XA, B,=XB, C, = XC. (18) 


Les plans P et Q se confondent si et seulement si, outre la relation (18), est 
vérifiée (pour le même X) l'égalité 


D, = XD. (19) 


DÉMONSTRATION. La condition est nécessaire. En effet, selon la pro- 
position 5, les équations des plans P et Q peuvent être représentées sous la 
forme (r —- r,n) = Oet(r-r,,n,) = 0,oùnet n, sont des vecteurs liés 
aux coefficients des équations par les formules (13). Si les plans sont paral- 
lèles, net n, sont colinéaires et, par suite, il existe un nombre X tel quen, = 
= Àn. En vertu de (13) on a 4, = (e,,n,) = À(e,,n) = XA. On obtient de 
façon analogue les autres égalités de (18). Posons maintenant que P et Q 
coïncident. Alors d’après ce qui a êté démontré plus haut, l’équation de Q 
est de la forme A(Ax + By + Cz) + D, = 0. Vu que les plans possèdent 
un point commun, il découle de 


ÀA(AX, + By, + CZ) + D, = 0 et Ax, + By, + Cr + D=0 


que D, = XD. 

La condition est suffisante. Il nous faut démontrer que deux équations 
satisfaisant aux conditions (18) et (19) sont des équations d’un même plan 
et que les équations satisfaisant à la condition (18) définissent des plans 
parallèles. La première assertion est évidente, vu que ces équations sont 
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équivalentes. La seconde assertion résulte de la proposition 2. En effet, si 
les conditions (18) sont satisfaites, les composantes des vecteurs directeurs 
des deux plans doivent vérifier la même équation. Or cela signifie que le 
même couple de vecteurs joue le rôle de vecteurs directeurs de l’un et de 
l’autre plan. La proposition est démontrée. 

Les conditions (16) ne signifient rien d'autre que le fait que les vecteurs 
de composantes (4, B) et (A,, B,) sont colinéaires. De façon analogue, 
les conditions (18) affirment la colinéarité des vecteurs de composantes 
(4, B,C)et(A,,B,, C,). D'où la possibilité d'écrire la condition de paral- 
lélisme de deux droites du plan sous la forme 


A B 
| = 0, (16°) 
A, B, 
et la condition de parallélisme de deux plans sous la forme 
B C C A A B 
= = = (0. (18°) 
B, C C, À, A, B, 


(Voir les propositions 9 et 10, $ 3, ch. I.) 

La proposition 8 peut être énoncée sous une forme purement algébrique 
si l’on tient compte du fait que les coordonnées du point d’intersection des 
droites représentent la solution du système de leurs équations. 


PROPOSITION 10. Si 


le système d'équations 
Ax + Bÿy+C=0, A;x+By+C,=0 
n'a pas de solutions ou en possède une infinité (suivant C et C;). Si 
A B 
É, 2 
le système a une solution unique (x, y) quels que soient C et C.. 


Il va de soi que la proposition 10 se démontre aisément de façon directe 
sans recourir à des considérations géométriques. Pour un cas plus général 
on effectuera cette démonstration au chapitre V. Une telle démonstration 
n’est qu’une autre démonstration de la proposition 8. 


+ 0, 


6. Equations de la droite dans l’espace. Une droite dans l’espace peut 
être définie comme l'intersection de deux plans et, par suite, dans un repère 
cartésien quelconque se définit par le système d’équations 


Ax + By+Cz+D=0, A x+B,y+C,z+D,=0. (20) 
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La condition de parallélisme de deux plans permet d’indiquer quand le 
système (20) définit une droite unique. L’intersection de deux plans est une 
droite si et seulement s’ils ne sont pas parallèles (et, en particulier, ne se 
confondent pas). Aussi le système (20) définit-il une droite unique si et seu- 
lement si l’un au moins des déterminants (18°) est différent de zéro, c’est-à- 
dire si 


" 


# 0. (21) 


B C |? C A |? u B 
B, C, C;, À, A, B, 

Il va de soi que le système (20) peut être remplacé par tout système équi- 
valent. Dans ce cas la droite sera représentée par l’intersection de deux 


autres plans passant par elle. Les équations (10) la représentent comme 
l'intersection des plans 


TH 727% XX LT 
a, ay a, a, 


respectivement parallèles aux axes d’abscisses et de cotes. 

Il est important de savoir trouver un point initial et un vecteur directeur 
de la droite définie par le système d'équations linéaires. La condition (21) 
signifie que des trois déterminants d’ordre 2 un au moins est différent de 
zéro. Posons pour fixer les idées que AB, — 4,B + 0. Pour obtenir un 
point initial de la droite, considérons le système (20) comme un système 
d’équations en x et y. Donnons à la variable z une valeur numérique arbi- 
traire, par exemple 0. On a alors pour x et y le système d’équations 


AX + Bÿy+D=0, A,x+8B,y + D, = 0. 


En vertu de la proposition 10, ce système a une solution qu’on notera 
(x: Yo). Le point M, de coordonnées (x,, y,, 0) se trouve alors sur la droite 
car ses coordonnées vérifient le système (20). 

Cherchons maintenant le vecteur directeur. Si le repère cartésien est rec- 
tangulaire, les vecteurs de composantes 4, B, Cet 4,, B,, C, sont perpen- 
diculaires aux plans Ax + By + Cz + D = Oet A,x + B,y + C,z + 
+ D, = 0. Donc, le produit vectoriel de ces vecteurs est parallèle à la droite 
(20) suivant laquelle les plans se coupent. En calculant les composantes du 
produit vectoriel dans une base orthonormée, on obtient les composantes 
suivantes du vecteur directeur de la droite : 


ri C À ES 
B, Cl” IC, Al" 14, 8,1 


PROPOSITION 11. Le vecteur de composantes (22) est le vecteur directeur 
de la droite (20) quel que soit le repère cartésien. 


(22) 
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DÉMONSTRATION. Selon la proposition 2, tout vecteur non nul dont 
les composantes a,, æ,, æ, vérifient l’équation Aa, + Ba, + Ca, = Oest 
parallèle au plan Ax + By + Cz + D = 0. Si en outre «,, «,, «, vérifient 
l'équation À, a, + B,a, + C,a, = 0, le vecteur est aussi parallèle au plan 
A,x + B,y + C;z + D, = 0et, partant, peut être pris pour vecteur direc- 
teur de la droite (20). Le vecteur de composantes (22) n’est pas nul en vertu 
de la relation (21). Il est aisé de vérifier immédiatement que ses composan- 
tes satisfont aux deux conditions posées plus haut. La démonstration est 
ainsi achevée. 


$ 3. Quelques problèmes sur les droites et les plans 


1. Equation d’une droite passant par deux points. Soient donnés dans 
l’espace un repère cartésien quelconque et deux points M, et M, de coor- 
données (x,, y,, z,) et (x;, y,, z,). Pour écrire l’équation de la droite pas- 
sant par M, et M, il suffit de prendre M, pour son point initial et M, M, 
pour son vecteur directeur. Ce vecteur n’est pas nul si les points ne se con- 
fondent pas. D’après la formule (10) du $ 2 il vient 


XX MY) Gi 


Si dans ces égalités l’un quelconque des dénominateurs est nul, on doit éga- 
ler à zéro le numérateur correspondant. 

En géométrie plane le problème est résolu de la même façon. La diffé- 
rence réside dans le fait que les coordonnées des points sont maintenant 
(x,, »,) et (x,, y,), et l’on obtient (selon les propositions 3 et 4 du $ 2) 
l'équation 


y = 22 L(x-x) (2) 
X; — X; 
si X, # X;, et 
X=X, 


Si X, = X;. 

2. Equation d’un plan passant par trois points. Soient dans un repère 
cartésien trois points non alignés M,, M,, M, de coordonnées (x,, y,, z;), 
(x, J>, 2) et (X,, Y3, Z,). Pour écrire l’équation du plan passant par ces 
points choisissons le point M, pour point initial et les vecteurs M1, M, et 
M M, pour vecteurs directeurs. Alors selon les formules (11°) du $ 2et les 
formules (10) du $ 3, ch. I, il vient 


XX MY Ru] = 0. 
XX Vs), 3 — 
5—6442 
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3. Conditions de parallélisme d’une droite et d’un plan. Supposons que 
la droite est définie par l’équation Fr — r, = ta, et le plan par l’une des 
équations (r — r,,n) = O,(r — r,,p,q) = Oour-r, =1,p + f,q. La 
droite est parallèle au plan (ou peut-être s’y trouve) si 


(a, n) = 0 ou (a, p, q) = 0. 


Posons que le plan est défini par l’équation linéaire Ax + By + Cz + 
+ D = 0. Il vient 


(n, a) = (n,e,)a, + (n,e,)a, + (n, .. = 0. 
D'où, en appliquant les formules (13) du $ 2, on obtient 
Aa, + Ba, + Ca, = 0. (3) 

Posons que la droite est définie par deux équations linéaires 

A, xX+By+Crz+D,=0, A,x + B,y + C,z + D, = 0. 
Alors en se conformant à la proposition 11 du $ 2, on peut poser 
C, À, 
B, C, C, À, 


et la condition (3) s’écrit sous la forme 


a, = a, = a, = 
1 2 3 
À, B, 


À, B, 
A, B, 


A + B + C = 0, 


B, C, C, À, 


ou bien 
A BC 
A, B,C,|=0. (4) 
On vérifie aisément que toutes les conditions mentionnées ici sont non 
seulement nécessaires mais aussi suffisantes. 


Il découle de la formule (4) que trois plans se coupent en un point si et 
seulement si les coefficients de leurs équations satisfont à la condition 


A BC 
A, B,C,| #0. (S) 
A, B, C; 
En effet, cette inégalité signifie que la droite d’intersection de deux quel- 
conques de ces plans n’est pas parallèle au troisième plan. 


4. Equations du plan et de la droite en fonction de leurs coordonnées à 
l’origine. On appelle équation du plan en fonction de ses coordonnées à 
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l'origine l’équation de la forme 
Z 
— ++ + = =]. (6) 
C 


PROPOSITION 1. Si le plan est défini par l'équation (6) dans un repère car- 
tésien rectangulaire, les nombres a, b, c sont égaux en valeur absolue à la 
longueur des segments interceptés par le plan sur les axes de coordonnées 
(fig. 22). Le signe de ces nombres dépend de la position du segment corres- 
pondant sur le demi-axe (positif ou négatif). 


Fig. 22. 


Pour justifier cette proposition il suffit de porter dans l’équation (6) les 
triplets de nombres suivants : (a, 0, 0), (0, b, 0) et (0, 0, c). 
L’équation de la droite dans le plan en fonction de ses coordonnées à 
l’origine est de la forme 
x 


y 
TA. 7 
RUE (7) 


Cette équation vérifie une proposition analogue à la proposition 1. 


S. Demi-espace. Soient un plan P et le vecteur normal n de P. On 
appelle demi-espace defini par P et n l’ensemble des points M tels que, 
étant donné un point M, du plan P, l’angle des vecteurs n et MM soit au 
plus égal à xr/2. 

Si rest le rayon vecteur du point M, et r, du point M, la définition du 
demi-espace est équivalente à l’inégalité (r — r,,n) > 0. Cette inégalité est 
justement l'équation du demi-espace. 

En utilisant ce fait, il est aisé de vérifier que la définition du demi- 
espace ne dépend pas du choix du point M, dans le plan. En effet, si 
M, (1, ) est un autre point du plan, le vecteur a = r, — r, est perpendicu- 
laiïreàn,etona 

r-r,n=(tr-r+an)=(-r,,n). 
5* 
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On obtient l’équation du demi-espace en coordonnées si l’on se sou- 
vient que l’expression (Fr — r,, n) s’écrit en coordonnées au moyen du poly- 
nôme Ax + By + Cz + D. Ainsi donc, dans le repère cartésien, le demi- 
espace est défini par l’inéquation linéaire 


AX + By +Cz+D2>to0. 


Inversement, selon la proposition 5 du $ 2, toute inéquation linéaire peut 
être écrite sous la forme (r — r,, n) > 0, d’où l’on obtient immédiatement 
qu’elle définit un demi-espace. 

Le plan P et le vecteur n° = —n déterminent un autre demi-espace 
défini par l’inéquation (r — Fr, n°) > 0,ou(r — r,,n) < 0. Il peut être 
appelé demi-espace « négatif » pour le différencier du demi-espace « posi- 
üf»(r—-r,n) > 0. Mais cette appellation est conventionnelle vu qu’elle 
dépend du choix du vecteur n. Le changement du sens de ce vecteur équi- 
vaut au changement des signes des coefficients et du terme constant dans 
l'équation du plan ou à une multiplication de l’équation du plan par un 
facteur négatif. Avec cela, le demi-espace « positif » devient « négatif » et 
réciproquement. 

Si M,(x,, y,, z,) et M,(x,, y,, z,) sont deux points non situés dans le 
plan donné, et Ax, + By, + Cz, + Det Ax, + By, + C2, + D les résul- 
tats de substitution de leurs coordonnées dans le premier membre de 
l’équation du plan, la coïncidence ou la non-coïncidence des signes de ces 
nombres est indépendante du choix du vecteur ñn ou de la multiplication de 
l'équation du plan par un facteur numérique. Dans le cas de coïncidence 
des signes, les points M, et M, se trouvent dans un même demi-espace. 

Dans la résolution des problèmes, la remarque suivante peut présenter 
de l'intérêt : si le point de coordonnées x,, y, z, est dans le plan, le point de 
coordonnées x, + À, y, + Bet z, + C se trouve dans le demi-espace 
« positif ». Autrement dit, le vecteur de composantes 4, B, Cest toujours 
orienté vers le demi-espace « positif ». Le lecteur peut le vérifier aisément 
par substitution immédiate. 

D'une façon analogue à ce qui vient d’être dit sur les demi-espaces, on 
peut définir un demi-plan et démontrer que l’inéquation Ax + By + C 2 
> 0, qui relie les coordonnées cartésiennes d’un point dans le plan, définit 
un demi-plan. Le second demi-plan ayant pour frontière la droite Ax + 
+ By + C = Oest défini par l’inéquation Àx + By + C < 0. 


6. Distance d’un point à un plan. Soient donnés un plan d’équation 
(r — 5, p, q) = 0 et un point M de rayon vecteur R. La distance du point 
M au plan se détermine le plus aisément si l’on divise le volume du parallé- 
lépipède construit sur les vecteurs R — r,, p et q par l’aire de sa base 
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e: 


Fig. 23. 


(fig. 23). On obtient 


_ IR-1r,p,q)l 


l[p, q)! 


Pour tout vecteur n normal au plan on peut choisir les vecteurs directeurs p 
et q de façon que [P, q] = n. Aussi pour tout vecteur normal A a-t-on 
[(R — r,,n)! 
Dr OP, 8 
In! @) 


Si dans le repère cartésien rectangulaire le point M a pour coordonnées 
X, Y, Z, l'égalité (8) s’écrira (proposition 6, $ 2) 


LAX + BY + CZ + Di 


h = (9) 
VA? + B? + C? 
Ici D = —(r,, n)et 4, B, C sont les composantes de n. 


Il est évident que À = 0 si et seulement si M est dans le plan. L'équation 
Ax + By +Cx+D _ 


s’appelle équation normée du plan. 

PROPOSITION 2. La distance d'un point à un plan est égale à la valeur absolue du résultat 
de substitution de ses coordonnées dans l'équation normée du plan. 

7. Distance d’un point à une droite. Si la droite est définie par l’équa- 
tion [r — r,, a] = 0, on est en mesure de trouver la distance k du point de 
rayon vecteur R à cette droite en divisant l’aire du ‘parallélogramme cons- 
truit sur les vecteurs R — r, et a par la longueur de sa base (fig. 24). Le 
résultat peut être exprimé par la formule 

h = IR = r,all : (10) 
lal 
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Fig. 24. 


Nous omettons d'écrire cette expression en coordonnées si la droite est 
définie dans l’espace. Considérons une droite dans le plan. Soit Ax + 
+ By + C = 0 son équation dans le repère cartésien rectangulaire. Pre- 
nons pour vecteur directeur le vecteur a(— B, À). Selon la formule (15), 
$ 3, ch. I, 

h = XX) A = = NB) on 


VA? + B? 
où M, (xs, Yo) est un point de la droite, X, Y les composantes de R. Ayant 
en vue que € = — Ax, — By,, on obtient 
_ LAaX + BY + CI 


VA? + B? 


En partant de (11) on remarque aisément que 


h (12) 


he [(R — Po, n)l 
inl s 


où n(4, B)est le vecteur normal de la droite. En comparant cette expres- 
sion à la formule (8), on voit que l’analogie entre plans et droites dans le 
plan se conserve également dans ce problème. 

L'équation de la forme 


s'appelle équation normée de la droite dans le plan. S’y rapporte une proposition analogue à 
la proposition 2. 


8. Distance entre deux droites non parallèles dans l’espace. Soient p et q 
deux droites non parallèles. On sait que dans ce cas il existe deux plans 
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parallèles P et Q tels que la droite p appartient au plan P et la droite g au 
plan Q. (Si les équations des droites sont r — r, = ta;etr-r, = 1a,,le 
plan P a pour point initial r, et pour vecteurs directeurs a, et a,. De façon 
analogue se construit le plan Q.) La distance h entre les plans P et Q est la 
distance entre les droites p et q. Si p et q se coupent, Pet Q se confondent et 
h = 0. 

Pour calculer la distance h, le plus simple est de diviser le volume du 
parallélépipède porté par les vecteurs r, — r,, a, et a, par l’aire de sa base 
(fig. 25). Il vient 
1 — M a), a,)l 

I[a,, a)! | 


Le dénominateur de cette expression est différent de zéro vu que les droites 
ne sont pas parallèles. 


Fig. 25. 


PROPOSITION3. Deux droites d'équations r = Fr, + a,tetr=Tr, + a,tse 
coupent si et seulement si h = 0, c'est-a-dire si 


(r, — nr, a,,a,) = 0, [a,,a,] + 0. 


9. Calcul des angles. Pour déterminer l’angle de deux droites, il faut 
rechercher leurs vecteurs directeurs et calculer l’angle qu'ils forment 
d’après la formule (4) du $ 3, ch. I. Ceci étant, il faut avoir en vue qu’en 
choisissant, sur l’une des droites, le vecteur directeur de sens contraire, on 
obtient un angle adjacent supplémentaire. 

Pour déterminer l’angle entre la droite et le plan, on définit l’angle 8 
entre le vecteur directeur de la droite et le vecteur perpendiculaire au plan. 
Si le vecteur directeur de la droite est choisi de sorte que cos 8 > 0,et0 < 
< 0 < x/2, l’angle entre la droite et le plan est le complémentaire de 06. 

L’angle de deux plans est celui des vecteurs perpendiculaires aux plans. 

Les calculs se font le plus aisément dans le repère cartésien rectangu- 
laire. Pour vecteur perpendiculaire au plan on peut alors choisir le vecteur 
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de composantes égales aux coefficients associés aux variables de l’équation 
de ce plan. 

Supposons que deux droites du plan sont définies dans le repère carté- 
sien rectangulaire par les équations 


Y=Kx+b, y=Rk;x + b.. (13) 


Désignons par 4 l’angle mesuré de la première droite à la seconde dans le 
sens de la plus petite rotation amenant le premier vecteur de base sur le 
second ; tg w est la tangente de la différence des angles que les droites for- 
ment avec l’axe des abscisses. Or les tangentes de ces derniers sont égales 
aux coefficients angulaires des droites. Il vient alors 


Be=-2 1, (14) 


Il faut souligner que cette formule perd son sens quand le dénominateur 
s’annule. Dans ce cas les droites sont perpendiculaires. En effet, selon la 
proposition 1! du $ 2, les vecteurs de composantes (1, £,) et (1, k,) sont les 
vecteurs directeurs des droites et leur produit scalaire est 1 + Æ,X,. 


PROPOSITION 4. Pour que les droites (13) soient perpendiculaires, il faut 
et il suffit que soit remplie l'égalité 


l+4kk, = 0. 


10. Signification géométrique de l’ordre d’une courbe algébrique. Soit 
donnée dans le plan une courbe algébrique L dont l’équation dans le repère 


Cartésien est 
A,xk ph + AÀ,xk2ph +... + 4 x ph = 0. (15) 


Considérons dans le même repère une droite définie par les équations para- 
métriques 

X=X) +al, Y=Y) + lt. (16) 
Cherchon:s les points d’intersections de la droite avec la courbe Z. Ils seront 
connus si l’on trouve les valeurs correspondantes du paramètre £. Ce seront 
les valeurs pour lesquelles x et y exprimés par les formules (16) vérifieront 
l’équation (15). Portons (16) dans (15), il vient 
A, (X +40) + a 1)h + … 

. + 4,(% +40)6 (y + at) = 0. (17) 

En chassant les parenthèses dans chaque terme, on obtient des polynômes 
en { de degrés k, + /,,..., k, + [.. Leur somme est un polynôme en t de 
degré au plus égal au degré maximal des termes. Or le plus grand des nom- 


bres k, + /,,...,k. + [est l’ordre de la courbe L. Donc, le degré de l’équa- 
tion (17) ne dépasse pas l’ordre de la courbe. 
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Il se peut évidemment que tous les coefficients de l’équation soient 
égaux à zéro et cette dernière constitue une identité. Dans ce cas tous les 
points de la droite appartiennent à la courbe. Si l’on exclut ce cas, le nom- 
bre de racines de l'équation, et, partant, de points d’intersection, ne 
dépasse pas l’ordre de la courbe. On a ainsi démontré la proposition sui- 
vante. 


PROPOSITIONS. Le nombre de points d'intersection de la courbe algébri- 
que L avec la droite qui n’y appartient pas toute entière ne peut dépasser 
l’ordre de la courbe L. 

Il existe des courbes dont le nombre maximal de points d’intersection 
avec une droite n’est jamais égal à l’ordre de la courbe. C’est le cas par 
exemple de la courbe d’ordre 4 dont l’équation dans le repère cartesien rec- 
tangulaire est y = x“. Elle coupe toute droite en deux points au plus 
(fig. 26). 


Fig. 26. Courbe d’équation y = x‘ 


EXEMPLE. La spirale d’Archimède est la courbe d’équation 7 = ag 
dans le système de coordonnées polaires ; chaque droite passant par le pôle 
la coupe en un nombre infini de points. Elle n’est donc pas une courbe algé- 
brique. 


CHAPITRE III 
CONIQUES ET QUADRIQUES 


Dans les deux premiers paragraphes de ce chapitre, on traitera des cour- 
bes planes du deuxième ordre appelées aussi coniques. Une telle courbe 
peut être définie par une équation du second degré, de forme générale *) 


Ax? + 2Bxy + Cy? + 2Dx + 2Ey + F= 0, (1) 


où les coefficients À, B et C ne sont pas simultanément nuls. 
$ 1. Etude de l’équation du second degré 


Proposons-nous d'étudier une conique. A cet effet, considérons l’équa- 
tion (1) dans laquelle les coefficients 4, B et C ne s’annulent pas simultané- 
ment. Cherchons un ensemble de points vérifiant l’équation (1), sans savoir 
à priori si au moins un de ces points existe. Pour cela, on procédera aux 
changements du repère cartésien afin de rendre l’équation (1) aussi simple 
que possible et on admettra dès le début que le repère cartésien est rectan- 
gulaire, vu que le passage à un repère rectangulaire ne fait pas varier la 
forme générale de l’équation (1). 

Si on fait tourner le repère cartésien rectangulaire de l'angle g, les 
anciennes coordonnées x, y deviennent liées aux nouvelles coordonnées x”, 
y’ par les formules de passage (voir (7), $ 4, ch. 1) 


XxX=Xx"cosp — y'sing, y=Xx"siINpg + y'COSY. 
Dans les nouvelles coordonnées, l’équation (1) prend la forme 
A(x'cose — y'sine)? + 2B(x°cosg — y’sing) x 
X (x'sing + y'cosw) + C(x’sing + y’ cos w)? + …. = 0. 


Les points de suspension désignent ici les termes du premier degré en x‘ et 
} ”, ainsi que le terme constant, que nous n’avons pas besoin d’expliciter. 


*) Les coefficients affectant le produit des variables x et y et leurs puissances premières 
sont notès 2B, 2D et 2E, vu que plus loin on aura affaire aux moitiés de ces coefficients. 
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On s’intéressera dans l’équation transformée au terme qui contient le pro- 
duit x ‘y ‘. On peut calculer aisément que son coefficient est 


B'= —-Asinscoss + B(cos?# — sin?) + Csinyvcose, 


car les termes non écrits ne renferment pas le produit x ‘y’. Si B = 0, on 
ne fera pas tourner le repère. Si B + 0, choisissons un angle & de manière 
que B° s’annule. Cette exigence implique l’équation 2Bcos 2» = 
= (4 — C)sin 2 en w. Si À = C, cos 29 = 0 et l’on peut poser $ = +/4. 


Mais si À # C, on choisit © = : Arctg[2B/(A — O)]. Il est essentiel qu’il 


existe toujours au moins un angle # pour lequel B° s’annule. Ainsi, après 
avoir tourné le repère de l’angle #, on obtient 


Ax ?+Cy?+2D'x +2E y +F'=0. (2) 
Les expressions des coefficients de l’équation (2) en fonction des coeffi- 
cients de l’équation (1) et de l’angle # s’obtiennent facilement mais on n’en 
a pas besoin. L’important est que par rotation du repère l’équation arbi- 
traire du second degré puisse être ramenée à la forme (2). B ‘est maintenant 


nul, les autres coefficients étant toujours considérés arbitraires. 
Enonçons la proposition auxiliaire suivante. 


PROPOSsITION1. Si le carré d’une des coordonnées figure dans l'équation 
(2) avec coefficient non nul, on peut, par déplacement de l'origine des 
coordonnées le long de l'axe correspondant, rendre nul le terme contenant 
la puissance première de cette coordonnée. 


En effet, soit par exemple À ” # 0. Ecrivons (2) sous la forme 
° ° 2 7? 
A'(x° + D x° + (2) ) + Cy?+2E y +F'- _ = 0. 


Si l’on effectue le déplacement de J’origine des coordonnées défini par les 
formules x °° = x° + D‘/A°,y°" = y’, l'équation (2) prend la forme 


A x °°? + C'y'"? + 2E'y'° + F:° = 0. 


La proposition est démontrée. 

A) Supposons que dans l'équation (2) on a A°C° + 0, c’est-à-dire que 
A” et C° sont tous les deux différents de zéro. Selon la proposition 1, 
l'équation peut être mise sous la forme 


Ax 2+Cy ?+F"=0. (2°) 
On peut faire les hypothèses suivantes sur les signes des coefficients de cette 
équation. 
1) Les coefficients À ” et C” ont même signe. Quant au signe de F””,ily 
a trois éventualités : 
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a) Le signe de F”” est opposé à celui de À ‘ et C’. Faisons passer F°° 
dans le second membre de l’égalité et divisons-la par F °°. L’équation prend 
la forme _ ee 

x pp .. 
a + ET 1, (3) 
oùa?= —-F'"/A',b?= —-F''/C:. 

On peut admettre que dans cette équation on a a > b. En effet, si a < 
< b, on procède à un nouveau changement de coordonnées 


x" =}, }'=x. (4) 


DÉFINITION. La courbe qui dans .un repère cartésien rectangulaire est 
définie par l’équation (3) pour a > b s’appelle ellipse, et l’équation (3) 
équation canonique de l'ellipse. ? 

Pour a = b, l’équation (3) est l'équation du cercle de rayon a. Donc, le 
cercle est un cas particulier de l’ellipse. 

b) Le signe de F”” est le même que celui de À ‘et C”. Comme précédem- 
ment, on peut alors réduire l’équation à la forme 


°°? °°2 
+2 = 1. (S) 


Cette équation n’est vérifiée par les coordonnées d’aucun point. L’équa- 
tion réduite à la forme canonique (5) est appelée équation de l’ellipse imagi- 
naire. 
c) F°° = 0. L’équation prend la forme 
ax "2+cy 2=0. (6) 


Elle est vérifiée par un seul point x °” = 0, y” = 0. L’équation réduite à la 
forme canonique (6) s’appelle équation d’un couple de droites sécantes 
imaginaires. La raison de cette appellation est puisée dans la ressemblance 
avec l’équation (8) produite plus bas. 

2) Les coefficients À ‘ et C‘ sont de signes opposées. En ce qui concerne 
le terme constant, deux éventualités se présentent. 

a) F°° # 0. Si nécessaire, en effectuant la substitution (4), on peut 
admettre que le signe de F ”” est opposé à celui de À ‘. L’équation se réduit 
alors à la forme 

x"? p°2 
a  b? 
oùa?= —F'"/A',b? = F''/C:. 

DÉFINITION. La courbe qui dans un repère cartésien rectangulaire peut 
être définie par l’équation (7) s’appelle hyperbole, et l'équation (7) équa- 
tion canonique de l’hyperbole. 


= |, (7) 


$ 1] ÉTUDE DE L'ÉQUATION DU SECOND DEGRÉ 77 


b) F”” = 0. L’équation prend la forme 
ax "?—cly'?2=0. (8) 
Son premier membre se décompose en facteurs 
(ex "ax" +") 


et, par suite, s’annule si et seulement si l’un au moins des facteurs est nul. 
Aussi la courbe d’équation (8) est-elle constituée de deux droites. Ces droi- 
tes se coupent à l’origine des coordonnées et on a ainsi un couple de droites 
sécantes. 

B) Admeïrtons maintenant que À °C’ = 0 et que, par suite, l’un des 
coefficients À ‘ou C ‘est nul. En cas de nécessité, en effectuant la substitu- 
tion (4), on peut considérer que À ” = 0. Signalons que C” # 0, car autre- 
ment le degré de l’équation (2) diminuerait. En se servant de la proposition 1 
on peut réduire l’équation de la courbe à la forme 


C'y'?2+2D'x +F"=0. 


a) Posons que D‘ + 0. Groupons les termes de la façon suivante : 
F°° 
C'y'?+ 2D° (x + Er) = 
} 2D° 


Maintenant il devient évident qu’en déplaçant l’origine des coordonnées le 
long de l’axe des abscisses, en accord avec les formules de passage x* = 
= x + F°7/2D",y* = y’”, on réduit l’équation à la forme 


C'y*2+2Dx* =0 


ou 
y*?= 2px*, (9) 


avec p = —D'’/C’. On peut admettre que p > 0, sinon on effectue le 
changement des coordonnées pour modifier le sens de l’axe des abscisses. 
DÉFINITION. La courbe qui dans .un repère cartésien rectangulaire peut 
être définie par l’équation (9), avec p > 0, s’appelle parabole, et l'équation 
(9) équation canonique de la parabole. 
b) Admettons maintenant que D’ = 0, c'est-à-dire que l’équation est de 
la forme 


C'y'°? + F'° _ 0. 


Si les signes de C‘ et F”” sont opposés, en divisant par C ‘on peut écrire 
y’? a?=(y"" — aXy'" + a) = 0. Chacune des relations y” — a = 0 
et y’ + a = 0 définit une droite, de sorte que la courbe se réduit à un 
couple de droites parallèles. 

Si les signes de C’ et F’° coïncident, en divisant par C” on réduit 
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l’équation à la forme canonique 
y''?+a=0. (10) 


Cette équation n'est vérifiée par aucun point. L’équation réduite à la forme 
canonique (10) s’appelle équation d’un couple de droites parallèles imagi- 
naires. 

Il peut arriver que F’° = 0. Alors l’équation de la courbe équivaut à 
y’"? = 0, si bien que la conique représente une droite. Si donc l’équation 
(1) se réduit à la forme canonique y ‘’? = 0, son premier membre est le 
carré d’un polynôme linéaire, de sorte que l’équation (1) est équivalente à 
une équation linéaire. Cette équation est appelée équation d'un couple de 
droites confondues. 

Rassemblons les résultats obtenus. 


THÉORÈME 1. Soit donnée, dans un repère cartésien, l'équation du 
second degré 


Ax? + 2Bxy + Cy? + 2Dx + 2Ey + F= 0. 


Il existe un repère cartésien rectangulaire dans lequel cette équation prend 
l’une des neuf formes canoniques suivantes : 


x? y? x? y? 
x?  p2 

3) ax? + ciy? = 0, Dec 

S) a?x? — cly? = 0, 6) y? = 2px, 

7)7y2-a2=0, 8) y? + a? = 0, 

9) y = 0. 


Il existe donc sept classes de coniques : 1) ellipses, 3) points (couples de 
droites sécantes imaginaires), 4) hyperboles, 5) couples de droites sécantes, 
6) paraboles, 7) couples de droites parallèles, 9) droites (couples de droites 
confondues). 

A l’équation 2) de l’ellipse imaginaire et à l’équation 8) du couple de 
droites parallèles imaginaires il ne correspond aucun point. 


$ 2. Ellipse, hyperbole et parabole 


Dans le paragraphe précédent, on a classifié les coniques. Il n’y a que 
trois classes de ces courbes dont les propriétés géométriques ne sont pas évi- 
dentes. On abordera leur étude dans le présent paragraphe. 


1. Ellipse. Rappelons que l’ellipse est par définition une courbe qui 
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dans un repère cartésien rectangulaire est définie par l’équation canonique 


avec a > b. Le repère dont il s’agit dans la définition est appelé repère 


canonique. 

Il découle immédiatement de (1) que pour tous les points de l’ellipse on 
a lxl < aet lyl < b, c'est-à-dire que l’ellipse s’inscrit dans le rectangle de 
côtés 2a et 2b. Les points d’intersection de l’ellipse avec les axes du repère 
canonique, dont les coordonnées sont (a, 0), (—a, 0), (0, b) et (0, —b), 
sont appelés sommets de l’ellipse. Les distances a et b entre l’origine des 
coordonnées et les sommets s'appellent respectivement demi-grand axe et 
demi-petit axe de l’ellipse. 

L’équation canonique (1) ne contenant que les carrés des coordonnées 
possède la propriété suivante : si elle est vérifiée par les coordonnées (x, y) 
d’un point M, elle l’est encore par les coordonnées (—x, y), (x, — y) et 
(—x, — y) des points M,, M, et M, (fig. 27). D'où la 


PROPOSITION 1. Les axes du repère canonique sont les axes de symétrie de 
l’ellipse et l’origine du repère canonique est son centre de symétrie. 


Le centre de symétrie de l’ellipse est appelé tout simplement son centre. 

Pour décrire la forme géométrique de l’ellipse (1), on la compare le plus 
souvent au cercle dont le rayon est a et dont le centre se confond avec le 
centre de l’ellipse. Ecrivons l’équation de ce cercle sous la forme 


x? y? 
a? a? 

Pour tout x tel que lxl < a il existe deux points du cercle d’ordonnées 
+av1 — x2/a2 et deux points de l’ellipse d’ordonnées +bV1 — x2/a2. 


Supposons qu’à tout point du cercle correspond un point de l’ellipse dont 
l’ordonnée est de même signe. Alors le rapport des ordonnées des points 
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Fig. 28. Ellipse obtenue par contraction du cercle pour b/a = 1/2 


correspondants est égal à b/a et on peut donc obtenir l’ellipse à partir du 
cercle par une contraction dans laquelle l’ordonnée de chaque point du cer- 
cle diminue dans un même rapport b/a (fig. 28). 

Pour effectuer une transformation géométrique du cercle en l’ellipse, 
prenons un deuxième plan P, qui coupe le plan initial P, suivant l’axe des 
abscisses sous l’angle « = Arccos (b/a) (fig. 29). Choisissons dans le plan 
P, un repère cartésien rectangulaire {O, e,, e;} dont l’origine et le vecteur 
de base e, se confondent avec l’origine et le vecteur e, du repère choisi dans 
le plan P,, et le vecteur e; forme l’angie & avec le vecteur e,. Considérons le 
cercle X? + Y? = a? dans le plan P... Si du point M(X, Y) de P, on abaisse 
la perpendiculaire sur le plan P,, les coordonnées (x, y) de son pied N 
s’obtiennent par les formules x = X, y = Ycosaæ = bŸ/a. Aussi l’ellipse 
est-elle l’ensemble des pieds des perpendiculaires abaissées des points du 
cercle ou, comme on dit, est la projection orthogonale du cercle. 


Fig. 29. 
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L’ellipse admet deux points remarquables appelés ses foyers. Soit par 
définition 
c? = a? — b? (2) 
et c > 0. On appelle foyers les points F et F, dont les coordonnées par rap- 
port au repère canonique sont respectivement (c, 0) et (—c, 0). 
Pour le cercle, c = 0 et les deux foyers se confondent au centre. On 


admettra plus bas que l’ellipse n’est pas un cercle. 
Le rapport 


a 


est appelé excentricité de l’ellipse. Signalons qu’on a toujours € < 1. 


PROPOSITION 2. La distance d'un point arbitraire M(x, y) de l’ellipse à 
chacun de ses foyers est une fonction linéaire de son abscisse x : 


r = IF MI het 
r, = |F,MI 
DÉMONSTRATION. Il va de soi que 


ÆTCENESE 


(fig. 30). En y portant l'expression de y? tirée de l’équation de l’ellipse, on 
obtient 


(4) 


a + EX. 


Transformons l’expression sous le radical en tenant compte de l’égalité (2). 
Il vient 

2,2 

c'x 
r = a? — 2CX + > * 

a 
On voit que sous le radical se trouve le carré d’un binôme linéaire, c’est-à- 
dire que r, = la — exl. Commee < let x < a, on en déduit que a — ex > 
> 0. On a démontré la première des égalités (4). La seconde se démontre de 
façon analogue. 


Fig. 30. 


6—6442 
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PROPOSITION 3. Pour qu'un point se trouve sur l’'ellipse il faut et il suffit 
que la somme de ses distances aux foyers soit égale à 2a, c’est-à-dire au 
grand axe de l’ellipse. 


La nécessite de la condition est évidente : si l’on additionne les égalités 
(4) membre à membre, on obtient 


r, tr) = 22. (5) 
Démontrons que la condition est suffisante. Supposons que la condi- 
tion (5) est satisfaite pour le point M(x, y), c’est-à-dire que 
V(x — c)2 + y2 = 2a — V(x + c)2 + y2. 


Elevons les deux membres de l’égalité au carré et réduisons les termes sem- 
blables : 


xc + a? = av(x + ©)? + y?. (6) 


Elevons également au carré cette égalité et réduisons les termes semblables 
en nous servant de la relation (2). On aboutit ainsi à l’égalité équivalente à 
(1). 

L’ellipse admet également deux droites remarquables appelées ses direc- 
trices. Leurs équations dans le repère canonique sont (fig. 31) : 


X = - et x= —-. (7) 
€ € 


La directrice et le foyer qui se trouvent d’un côté du centre sont consi- 
dérés comme correspondants l’une à l’autre. 


Fig. 31. 


PROPOSITION 4. Pour qu'un point se trouve sur l’ellipse il faut et il suffit 
que le rapport de ses distances au foyer et à la directrice correspondante 
soit égal à l'excentricité de l’ellipse €. 


Démontrons la proposition pour le foyer F,(—c, 0). Notons d, la dis- 
tance d’un point quelconque de l’ellipse MÆ{(x, y) à la directrice d’équation 
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x = —a/e&. Alors selon la formule (12) du $ 3, ch. II, on a 
d,=x+" Ge bo 
€ € 


ce qui diffère de l’expression (4) pour 7, par un seul facteur 1/€. 
Inversement, supposons que pour un point quelconque du plan on a 
r,/d, = €, c’est-à-dire que 


VGx + c)2 + y? : 


X + a/£ 


Compte tenu de ce que € = c/a, on réduit aisément cette égalité à la forme 
(6), de laquelle il résulte, comme on le sait, l’équation de l’ellipse (1). 

Pour le second foyer, la proposition découle de la symétrie de l’ellipse 
par rapport à l’axe des ordonnées du repère canonique. 

Cherchons maintenant l’équation de la tangente à l’eilipse définie par 
l’équation canonique. On sait que le coefficient angulaire de la droite tan- 
gente au graphique d’une fonction en un point (x;, y.) est égal à la dérivée 
de cette fonction au point x;. Posons y, # 0 et considérons la fonction f(x) 
dont le graphique est entièrement situé sur l’ellipse et passe par le point (x,, 
Yo). (Pour y, > 0, c’est la fonction f(x) = bvl — x2/a2, pour 


Yo < 0, la fonction f,(x) = 1 — x2/a2. Sans préciser le signe de y,, 
notons f(x) la fonction qui convient.) La fonction f(x) vérifie l’identité 
U(x))? _ 
= ©, UQY pi = |]. 
En la dérivant par rapport à x, on obtient 
2x  O2ff 
a bb? 


Portons x = x,, f(x) = y, dans l’égalité obtenue et résolvons-la par rap- 
port à / (x,). On obtient en vertu de y, # 0 


b? 
j' (x) = sd 2, 
2 Yo 
On est maintenant en mesure d’écrire l’équation de la tangente au point 
(os Yo) : 
Y — Yo = 2 (x x). 
0 y 0 
Pour simplifier cette équation, transformons-la sous la forme ayy, + 
+ bixx, = b?x + a?yi. Vu que le point (x,, },) vérifie l’équation de 


6 
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l’ellipse, on a b?x£ + a?y£ = a?b?, d’où a?yy, + bixx, = a?b?. Ainsi, 
l'équation de la tangente à l’ellipse au point (x;, y.) est de la forme 

XX , Yo _ 

2 + nn = 1. (8) 


En déduisant l’équation (8), on a exclu les sommets de l’ellipse (a, 0) et 
(— a, 0) en posant y, # 0. Pour ces points l’équation (8) se transforme res- 
pectivement en équations x = aetx = — a qui définissent les tangentes aux 
sommets. On peut le vérifier en remarquant que x, considéré comme une 
fonction de y, atteint son extrémum aux sommets. Laissons au lecteur le 
soin d’élucider la question en détail et montrer que l’équation (8) définit la 
tangente en tout point (x,, yo) de l’ellipse. 


PROPOSITIONS. La tangente à l’ellipse au point M,(x,, y,) est la bissec- 
trice de l'angle adjacent supplémentaire de l'angle formé par les segments 
joignant ce point aux foyers. 


DÉMONSTRATION. Soit L le point d’intersection de la tangente avec l’axe 
des abscisses (fig. 32). De l’équation (8) on tire aussitôt que son abscisse est 
a?/x,. Remarquons que a?/Ix,l > a et, partant, L se trouve à l’extérieur 
du segment F,F,. Les distances de L aux foyers sont égales à lF, LI = 
= la?/x, - clet IF; LI = la?/x, + cl et par suite, leur rapport 


2/x — Æ 
IF LI _ la/x,— cl _la- ax, 


IALI la/x,+cl la+exl 
est égal à celui des longueurs des segments MF, et M,F,. Il s'ensuit que 
M, L est la bissectrice de l’angle extérieur du triangle M,F,F,, ce qu'il fal- 
lait démontrer. Il faut remarquer que cette démonstration perd son sens 
pour les sommets de l’ellipse. Mais pour ces derniers l’assertion est évi- 
dente. 
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2. Hyperbole. On a appelé hyperbole une courbe qui dans un repère 
cartésien rectangulaire est définie par l’équation canonique 
x?  y2 
a b? 
Le repère dont il s’agit dans la définition est dit canonique. 

Il découle immédiatement de l’équation (9) que pour tous les points de 
l’hyperbole on a lxl > a, c’est-à-dire que tous les points de l’hyperbole se 
trouvent en dehors de la bande verticale large de 2a (fig. 33). L’axe des 
abscisses du repère canonique coupe l’hyperbole en deux points (a, 0) et 
(— a, 0) appelés sommets de l’hyperbole. L’axe des ordonnées ne coupe pas 
l’hyperbole. Les nombres a et b sont respectivement appelés demi-axe 
transverse et demi-axe non transverse de l’hyperbole. 

Exactement comme pour l’ellipse on démontre la proposition suivante. 


= Î. (9) 


Fig. 33. 


PROPOSITION 6. Les axes du repère canonique sont les axes de symétrie de 
l’hyperbole, et l’origine du repère canonique, son centre de symétrie. 


Le centre de symétrie de l’hyperbole est appelé son centre (fig. 33). 
Pour étudier la forme de l’hyperbole, cherchons son intersection avec 
une droite arbitraire passant par l’origine des coordonnées. Soit y = kx 
l'équation de la droite, car on sait déjà que la droite x = 0 ne coupe pas 
l’hyperbole. Les abscisses des points d’intersection s’obtiennent à partir de 
l'équation 
x? k2x2 : 


a?  b? 
ou si b? — ak? > O0, 
ab 
Vb2 = ak2 


X = + 
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On est ainsi en mesure d'indiquer les coordonnées de deux points d’inter- 


section : 
(ab/v, abk/v) et  (—ab/v, —abk/v), 


où u = (b? — a?k?)!/2, En vertu de la symétrie, il suffit de suivre le mouve- 
ment du premier point avec la variation de & (fig. 34). 


Fig. 34. 


Le numérateur de la fraction ab/v est constant, tandis que le dénomina- 
teur présente sa plus grande valeur pour £ = 0. Par suite, le point de coor- 
données (a, 0) possède la plus petite abscisse. Avec l’accroissement de 4 le 
dénominateur diminue et l’abscisse x augmente en tendant vers l’infini 
quand # s’approche du nombre b/a. L'hyperbole ne rencontre pas la droite 
y = bx/a de coefficient angulaire b/a et a fortiori, elle n’est coupée par 
aucune droite de coefficient angulaire plus grand que b/a. Mais toute 
droite de coefficient angulaire positif inférieur à b/a coupe l’hyperbole. 

Si on commence à tourner la droite à partir de la position horizontale 
dans le sens des aiguilles d’une montre, son coefficient £ diminue, tandis 
que £? augmente et la droite coupe l’hyperbole en des points qui s’éloignent 
de plus en plus, jusqu’à ce que le coefficient de la droite ne devienne égal à 
— b/a. A la droite y = —bx/a se rapporte tout ce qui a été dit à propos de 
y = bx/a : elle ne coupe pas l’hyperbole et sépare les droites qui la coupent 
de celles qui ne la coupent pas. 


DÉFINITION. Les droites définies dans un repère canonique par les équa- 
tions y = bx/a et y = —bx/a sont appelées asymptotes de l’hyperbole. 

Des raisonnements faits plus haut il découle que la représentation géo- 
métrique de l’hyperbole est celle de la figure 34. L’hyperbole est composée 
de deux parties appelées ses branches. 

Ecrivons les équations des asymptotes sous la forme bx — ay = Oet 
bx + ay = 0. Les distances du point M de coordonnées (x, y) aux asymp- 
totes sont respectivement égales à (comp. (12), $ 3, ch. II) 


Ron ue hp, = lox + ayl 
Var + bi Ÿ Var + bi 
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Si le point M est sur l’hyperbole, on a b?x? — ay? = ab'et 


sr lb2x? — aly?l ab? 
re a? + b? a? +b? 
PROPOSITION 7. Le produit des distances d’un point de l'hyperbole aux 
2h2 
a“b 
asymptotes est constant et vaut he 


D'où découle une importante propriété des asymptotes. 


PROPOSITIONS. Si un point se déplace sur l’hyperbole de manière que son 
abscisse augmente indéfiniment en valeur absolue, la distance de ce point à 
l’une des asymptotes tend vers zéro. 


En effet, au moins une des distances h, ou h, doit dans ces conditions 
croître indéfiniment, et si la proposition était fausse, le produit ne pourrait 
être constant. 

L’hyperbole admet deux points remarquables appelés ses foyers. Intro- 
duisons un nombre c en posant par définition 


c? = a? + b? (10) 


et c > 0. On appelle foyers de l’hyperbole dans le repère canonique les 
points F, et F, de coordonnées respectivement (c, 0) et (—c, 0) (fig. 35). 

Par analogie à l’ellipse, on appelle excentricité de l’hyperbole le rapport 
e = c/a. Pour l’hyperbole on a toujours € > I. 


Fig. 35. 


ProPosiTioN 9. Les distances d’un point arbitraire M(x, y) de l’hyper- 
bole à chacun des foyers dépendent de l’abscisse x de la façon suivante : 
r = IFMI= la — exl, 


11 
l = [FM = la + exl. A 


La démonstration de cette proposition reproduit mot à mot celle de la 
proposition 2 et l’on ne la répétera pas. 
Les égalités (11) peuvent être écrites d’une manière plus détaillée 
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Fig. 36. r, — r, = 2a,r, —r, = 2a 


(fig. 36) : pour x > a (branche droite de l’hyperbole) 
r=EX- a, 1, =EX+a; 

pour x < —a (branche gauche de l’hyperbole) 
r,=G—EX, F,= —EX— a. 


On voit que pour la branche droite de l’hyperbole on a r, — r, = 2aet 
pour la gauche, r, — r, = 2a. Dans les deux cas 


Ir, —r,l = 24. (12) 


Ceci démontre la nécessité de la condition énoncée dans la proposition 
suivante. 


PROPOSITION 10. Pour qu'un point appartienne à l’hyperbole il faut et il 
suffit que la valeur absolue de la différence de ses distances aux foyers soit 
égale à l'axe transverse de l’hyperbole. 


Pour démontrer que la condition est suffisante, on doit la mettre sous la 
forme 


+ V(x — c)2 + y? = 2a + V(x + c)2 + y2. 


Dans la suite, la démonstration s’écarte de celle de la proposition 3 par le 
seul fait qu’on se sert de l’égalité (10) au lieu d’utiliser l’égalité (2). 

A l’hyperbole se rattachent deux droites appelées ses directrices. Leurs 
équations dans le repère canonique sont : 


x="{ et x= ——. (13) 
€ € 
Les directrices de l’hyperbole sont plus proches du centre que ses som- 
mets et, par suite, ne coupent pas l’hyperbole. La directrice et le foyer se 
trouvant du même côté du centre seront considérés comme correspondants 
l’une à l’autre. 
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PROPOSITION 11. Pour qu'un point se trouve sur l’hyperbole il faut et il 
suffit que le rapport de ses distances au foyer et à la directrice correspon- 
dan!e soit égal à l'excentricité & de l’hyperbole. 


Démontrons cette proposition pour le foyer F,. Désignons par d, la dis- 
tance d’un point arbitraire de l’hyperbole M(x, y) à la directrice d’équa- 
tion x = —a/E (fig. 37). Alors, selon la formule (12) du $ 3, ch. IL, il vient 


| 
= — lex + al, 
€ 


a 
€ 


ce qui diffère de r, (comp. (11)) par le seul facteur 1/e. 


La suffisance de la condition se démontre de la même façon que pour la 
proposition 4 se rapportant à l’ellipse. 

L’équation de la tangente en un point (x,, y.) de l’hyperbole se déduit 
de la même façon que l’équation correspondante (8) pour l’ellipse. Elle est 
de la forme 


(14) 


PROPOSITION]2. La tangente à l’hyperbole au point MX Yo) est la bis- 
sectrice de l'angle formé par les segments joignant ce point aux foyers. 


La démonstration ne s’écarte presque pas de celle de la proposition 5. 
On recommande au lecteur de démontrer cette proposition ainsi que toutes 
les autres assertions sur l’hyperbole énoncées dans ce point mais non 
démontrées. 

3. Parabole. Rappelons que la parabole est par définition une courbe 
qui, dans un repère cartésien rectangulaire, est définie par l’équation cano- 
nique 

y? = 2px, (15) 


à la condition que p > 0. Le repère dont il s’agit dans la définition est dit 
canonique. 
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Il ressort de l’équation (15) que pour tous les points de la parabole on a 
x > 0. La parabole passe par l’origine du repère canonique. Ce point est 
appelé sommet de la parabole. 

L’équation de la parabole étant en même temps vérifiée par les points 
M{x,y)et M,(x, — y), l’axe des abscisses du repère canonique est un axe de 
symétrie de la parabole. 

La forme de la parabole est bien connue depuis l’école secondaire en 
tant que graphique de la fonction y = ax2. La différence entre les équa- 
tions est due au fait que par rapport au repère précédent on a changé de 
place les axes du repère canonique et désigné le coefficient a! par 2p. 

On appelle foyer F de la parabole rapportée au repère canonique le 
point de coordonnées (p/2, 0) (fig. 38). 


Fig. 38. 


La directrice de la parabole est la droite d’équation x = —p/2 dans le 
repère canonique. 


PROPOSITION13. La distance d’un point arbitraire de la parabole au foyer 
vaut 


P 
— + 7 
r=Xx 5 (16) 


Pour le démontrer, portons y? de l’équation (15) dans l'expression 7 = 
= V(x — p/2)2 + y? de la distance du point M(x, y) au foyer : 


p\° 
r = — 1) + px. 
( 7) Fe 
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En transformant le radicande, on obtient 
À 
r=|x+"- |, 
a+ 
ce qui entraîne (16) en vertu de x > O. 
Remarquons que d’après la formule (12) du $ 3, ch. II, la distance du 
point de la parabole à la directrice est aussi égale à 


p 
d=x+-, 
2 


d’où la nécessité de la condition énoncée dans la proposition suivante. 


PROPOSITION14. Pour qu'un point M appartienne à la parabole il faut et 
il suffit qu'il soit équidistant du foyer et de la directrice de cette parabole. 


Démontrons que la condition est.suffisante. Soit un point M{(x, y) équi- 
distant du foyer et de la directrice de la parabole (15), c’est-à-dire que 


2 
PŸ 2 _,.,P 
Pan + pc +. 
4 se 


En élevant cette égalité au carré et en réduisant les termes semblables, on en 
déduit l’équation de la parabole. La démonstration est donc achevée. 

On attribue à la parabole l’excentricité & = 1. En vertu de cette conven- 
tion, la formule 

ä € 

qui relie les distances du point de ia courbe au foyer et à la directrice, sera 
également vraie pour l’ellipse, pour l’hyperbole et pour la parabole. 

Déduisons l’équation de la tangente en un point M,(x,, yo) de la para- 
bole. Soit y, # 0. Considérons la fonction y = f(x) dont le graphique est 
entièrement situé sur la parabole et passe par le point M,. (C’est y = V2px 
ou y = —V2px, suivant le signe de y,.) La fonction f(x) vérifie l'identité 
UW{(x))? = 2px, dont la dérivation donne 2f(x}f'(x) = 2p. En substituant 

= x) et f(x) = »,, on obtient 


J (x) se A 
Yo 
puisque y, # 0. Maintenant on peut écrire l’équation de la tangente à la 
parabole : 


y = 2 (x- x). 
Yo 
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Pour la simplifier, chassons les parenthèses : yy, — y5 = px — px,, et 
signalons que y? = 2px,. Maintenant l'équation de la tangente à la para- 
bole prend sa forme définitive : 


YYo = p{x + Xo)- (17) 


Remarquons que pour le sommet de la parabole qu’on a exclu en 
posant y, # 0, l’équation (17) se transforme en l’équation x = 0, c’est-à- 
dire en l’équation de la tangente au sommet. Ainsi donc, l’équation (17) est 
vérifiée pour tout point M,(x,, y,) de la parabole. 


PROPOSITION15. La tangente à la parabole au point M, est la bissectrice 
d'un angle adjacent supplémentaire de l'angle formé par le segment joi- 
gnant le point M, au foyer et par la demi-droite issue de ce point en direc- 
tion de l’axe de la parabole (fig. 39). 


Fig. 39. 


DÉMONSTRATION. Le vecteur 1 dirigé le long de la bissectrice de l’angle 
mentionné dans la proposition est la somme e_ de deux vecteurs unités 
portés par les côtés de l’angle, c’est-à-dire de FM, / FM, | et de e,. Si les 
coordonnées de M, sont x, et y», FM, = (Xo — p/2e + Je, et |FM,|I = 
= X) + P/2. Donc, 


x) — p/2 ) } ] 
ne Pop) de dd 
( F2 it pa tx pra Con À ot) 


On peut maintenant calculer le coefficient angulaire de la bissectrice : k = 
= y/(2x,). On a calculé plus haut le coefficient angulaire de la tangente : 
k° = P/Yo Montrons que £ = K”. En effet, &/k° = yi/(2px,) = 1. La 
proposition est ainsi démontrée. 
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$ 3. Quadriques 


Par analogie au $ 2 où on a décrit les coniques les plus intéressantes, on 
traitera dans le présent paragraphe les quadriques (surfaces du deuxième 
ordre) les plus importantes, en reléguant au chapitre IX leur classification 
plus complète. Pour se représenter de façon générale la plupart des quadri- 
ques, on peut considérer les surfaces engendrées par rotation des coniques 
autour de leurs axes de symétrie. 

1. Surfaces de révolution. On dit que la surface S est surface de révolu- 
tion d’axe d si elle se compose de cercles situés dans des plans perpendicu- 
laires à la droite d et dont les centres appartiennent à cette droite. Cette 
définition peut être interprétée de la façon suivante. Considérons une 
courbe L située dans un plan P qui passe par l’axe de révolution d (fig. 40) 
et faisons-la tourner autour de cet axe. Chaque point de la courbe décrit 
alors un cercle, et toute la courbe, une surface de révolution. 


Fig. 40. 


Choisissons un repère cartésien rectangulaire {O, e,, e,, e.) de telle sorte 
que son origine appartienne à l’axe de révolution d, le vecteur e, soit dirigé 
le long de d et le vecteur e, situé dans le plan P. Ainsi donc, le point O et les 
vecteurs e, et e, constituent un repère cartésien dans le plan P. Supposons 
que la courbe Z dont la rotation engendre une surface soit définie dans ce 
repère par l’équation w(x, z) = 0. 

Considérons un point M{(x, y, z). Par ce point passe un cercle de centre 
sur l’axe d et qui se trouve dans le plan perpendiculaire à l’axe. Le rayon du 
cercle est égal à la distance séparant M de l’axe, c’est-à-dire à Vx2 + y2. Le 
point M se trouve sur la surface de révolution si et seulement si sur le cercle 
mentionné il existe un point M, appartenant à la courbe L. 

Le point M,(x,, y,, z,) se trouve dans le plan P, de sorte que y, = 0. 
En outre, z, = zet Ix,l = Vx2 + y2, car M, appartient au cercle passant 
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par M. Les coordonnées du point M, vérifient l’équation de la courbe 
L : (x,, z,) = 0. En portant x; et z, dans cette équation, on obtient la con- 
dition suivante pour les coordonnées du point M 


p(&Vx2 + y2,z) = 0, (1) 


qui est nécessaire et suffisante pour que le point M se trouve sur la surface 
de révolution S (l’égalité (1) doit être vérifiée pour l’un au moins des deux 
signes précédant la racine). Cette condition peut être écrite sous une forme 


équivalente 
p(Vx2 + y2,2z)e(—Vx2 + y2,2) = 0 (2) 


et constitue justement l’équation de la surface de révolution de la courbe L 
autour de l’axe d. 

2. Ellipsoide. Considérons les surfaces engendrées par rotation d’une 
ellipse autour de ses axes de symétrie. En dirigeant le vecteur e, d’abord le 
long du petit axe et ensuite le long du grand axe, on obtient l’équation de 
l’ellipse sous les formes suivantes 


a? oc? a ©. 
(c désigne ici le demi-petit axe de l’ellipse). En vertu de la formule (1), les 
équations des surfaces de révolution respectives seront 


RE 
x? + y? 2, G) 
a? cè 
Si 2 Fu 
z2 x2+p?. 
a? En (4) 


Les quadriques (3) et (4) sont appelées e//ipsoïdes de révolution aplati et 
allongé. On les a représentés sur la figure 41 a, b. 

Déplaçons chaque point M{(x, y, z) de l’ellipsoïde de révolution (3) vers 
le plan Y (plan de coordonnées passant par e, et e,) de manière que la dis- 
tance du point à ce plan diminue dans un rapport À < 1 constant pour tous 
les points. A la suite de ce déplacement, le point M vient se confondre avec 
le point M” dont les coordonnées sont définies par les égalités x ” = x, y ° = 
= Ày,z° = 2. Ainsi, tous les points de l’ellipsoïde de révolution (3) devien- 
nent des points de la surface d’équation 

x? y? 77? 
où b = Àa. La quadrique qui dans un repère cartésien rectangulaire a pour 
équation (5) est appelée ellipsolde (voir fig. 41, c). S’il arrive que b = c,on 
obtient encore un ellipsoïde de révolution mais, cette fois, allongé. 


$ 3] QUADRIQUES 95 


e, 8) 


Fig. 41. a), b) Ellipsoïdes de révolution aplati et allongé ; c) ellipsoïde 


L’ellipsoïde, tout comme l’ellipsoïde de révolution à partir duquel il a 
été obtenu, représente une surface bornée fermée. Il découle de l’équation 
(5) que l’ellipsoïde est symétrique par rapport à l’origine et par rapport aux 
plans de coordonnées. 

En effectuant une contraction, on arrive à obtenir un ellipsoïde à partir 
de l’ellipsoïde de révolution, tout comme on obtient une ellipse à partir du 
cercle. Par contraction de la sphère x2 + y? + z2 = a?, on peut obtenir 
l’ellipsoïde de révolution (3). Pour obtenir un ellipsoïde allongé à partir de 
la sphère, il faut effectuer une transformation analogue, cette fois avec 
à > 1, c’est-à-dire une traction. 

On reviendra à maintes reprises dans ce paragraphe à la contraction 
sans toutefois la décrire chaque fois en détail. 

3. Cône d'ordre 2. Considérons dans le plan P un couple de droites 
sécantes, défini dans le repère {O, e,, e,] par l’équation a?x? — c2z? = 0. 
La surface (fig. 42) engendrée par rotation de ces droites autour de l’axe 
des cotes a pour équation 


a?{(x? + y?) — ciz2 = 0 (6) 


et porte le nom de cône circulaire droit. La contraction vers le plan Y trans- 


96 CONIQUES ET QUADRIQUES [CH. 111 


forme le cône circulaire droit en une surface dont l’équation est 

a?x? + bly? — c2z2 = 0. (7) 
La quadrique qui dans un repère cartésien rectangulaire a pour équation (7) 
est appelée cône ou, d’une façon plus précise, cône d'ordre 2. Le cône est 


composé de droites passant par l’origine des coordonnées. Les sections du 
cône par les plans z = « sont, pour différents «, des ellipses 


a?x? + b?y? = c'a?. 


4. Hyperboloïde à une nappe. Un hyperboloïde de révolution à une 
nappe est une surface engendrée par rotation de l’hyperbole 


autour de son axe non transverse. La formule (1) permet d’obtenir l’équa- 
tion de l’hyperboloïde de révolution à une nappe 


——— — —= |. (8) 
En contractant cette surface, on obtient une quadrique d’équation 
x? op? 22. 


La quadrique qui, dans un repère cartésien rectangulaire, est définie par 
l’équation (9) s’appelle kyperboloïde à une nappe (fig. 43). 
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Fig. 43. 


Notons une propriété intéressante de cette surface : l’hyperboloïde à 
une nappe admet des génératrices rectilignes. On appelle ainsi les droites 
dont tous les points se trouvent sur la surface. Par tout point de 
l’hyperboloïde à une nappe passent deux génératrices rectilignes dont les 
équations peuvent être obtenues de la façon suivante. Portons le terme 
y?/b* dans le second membre de l'équation (9) et décomposons les deux 
membres de l’égalité en facteurs : 


DE -)-(22)(-2) 


Considérons maintenant une droite définie par les équations 


= 4 
(1 +2). 

_ (1-7 (10) 
a ( =>). 


où À et u sont des nombres. Les coordonnées de chaque point de cette 
droite doivent satisfaire à deux équations et, par suite, à leur produit, c’est-à- 
dire à l’équation (9). Ainsi donc, quels que soient X et u, tous les points de 
la droite d’équations (10) se trouvent sur l’hyperboloïde à une nappe. Le 
même raisonnement peut aussi être produit pour la famille de droites 


4-2) 


> FE 
QIX Qilx 
| + 
QIN  NIA 
st Nm 
Ù 


É 
QIX 
+ 
eREX 
ER, 
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En portant les coordonnées du point de l’hyperboloïde à une nappe dans 
l’une des équations (10) et l’une des équations (11), on obtient les valeurs 
des paramètres À, u et À’, u” correspondant aux génératrices rectilignes qui 
passent par ce point. Il est naturel que chaque couple de paramètres soit 
défini à un facteur commun près. 

Si on fait tourner l’hyperbole avec ses asymptotes, ces dernières décri- 
ront un cône circulaire droit appelé cône asymptote de l’hyperboloïde de 
révolution. La contraction de l’hyperboloïde de révolution en un 
hyperboloïde à une nappe entraîne celle du cône circulaire droit en un cône 
appelé cône asymptote de l’hyperboloïde à une nappe. 

S. Hyperboloïde à deux nappes. Un hyperboloïde de révolution à deux 
nappes est une surface engendrée par rotation de l’hyperbole 

7? , x? 

c? a? 
autour de son axe transverse. En vertu de la formule (1), l’équation de 
l’hyperboloïde de révolution à deux nappes est de la forme 


(12) 


La quadrique définie dans un repère cartésien rectangulaire par une équa- 
tion de la forme (13) s’appelle hyperboloïde à deux nappes (fig. 44). A 


Fig. 44. 
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deux branches de l’hyperbole correspondent ici deux parties de la surface 
(nappes) tandis que, dans le cas de l’hyperboloïde de révolution à une 
nappe, chaque branche de l’hyperbole engendre la surface entière. 

Le cône asymptote se définit pour l’hyperboloïde à deux nappes de la 
même façon que pour l’hyperboloïde à une nappe. 

6. Paraboloïde elliptique. En faisant tourner la parabole x? = 2pz 
autour de son axe de symétrie, on obtient une surface d’équation 


x? + y? = 2pz, (14) 


appelée paraboloïde de révolution. La contraction vers le plan y = Otrans- 
forme le paraboloïde de révolution en une surface d’équation 

æ + 5 = 2z. (15) 
La quadrique définie par une telle équation dans un repère cartésien rectan- 
gulaire est appelée paraboloïde elliptique (fig. 45). Sa forme géométrique 


est bien évidente. Signalons que les sections de cette surface par les plans 
z = a, avec æœ > 0, sont les ellipses 


x? y? 
—_—ÿ#—© + ———— = |, = à, 
204? 2ab? Fm 

tandis que les sections par des plans parallèles à d’autres plans de coordon- 

nées, par exemple par les plans y = «, représentent les paraboles De 


- : 
LS 


2 2 « 2 7 ; = °° 
X [0 4 L ARE a 
— + — = 27 = ©. PR De 1e 
a? b? + Von 
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7. Paraboloïde hyperbolique. Par analogie avec l’équation (15), on peut 
écrire l’equation 


— — — = 2Z. (16) 


La quadrique qui dans un repère cartésien rectangulaire prend la forme de 
l’équation (16) sera appelée paraboloïde hyperbolique. Etudions la forme 
géométrique de cette surface. Pour cela, considérons la section du 
paraboloïde hyperbolique par le plan x = a pour un « quelconque. Choi- 
sissons dans ce plan un repère cartésien rectangulaire {O”, e,, e,} d’origine 
au point O ‘(œ, 0, 0). Rapportée à ce repère, la ligne d’intersection a pour 


équation ; : 


Cette courbe est une parabole. On s’en assure facilement en reportant 
l’origine des coordonnées au point O’” de coordonnées (0, 2/24) (ses 
coordonnées dans l’espace par rapport au repère initial {O, e,, e,, e,] sont 
(æ, 0, «?/2a?)). Le point O’° est évidemment le sommet de la parabole, 
l’axe de la parabole est parallèle au vecteur e,, tandis que le signe moins 
dans le premier membre de l’égalité (17) signifie que les branches de la 
parabole sont dirigées dans le sens opposé à celui du vecteur e,. Signalons 
qu’après le transport de l’origine des coordonnées au point O‘”, l’équation 
de la parabole ne contient plus de « et, partant, toutes les sections du 
paraboloïde hyperbolique par les plans x = « sont des paraboles égales. 
Faisons varier æ et suivons le déplacement du sommet O ‘” de la para- 
bole en fonction de «. Les coordonnées (œ, 0, æ2/2a?) du point O‘* par 
rapport au repère [O, e,, e,, e,} permettent de conclure que ce point par- 
court une courbe définie dans le repère {O, e,, e,, e,] par les équations 


x? 
2a?° 


Cette courbe est une parabole du plan y = 0. Son sommet est à l’origine 
des coordonnées, son axe de symétrie se confond avec l’axe des cotes et ses 
branches sont de même sens que le vecteur e.. 

On peut maintenant construire un paraboloïde hyperbolique de la 
façon suivante. Etant donné deux paraboles, déplaçons l’une d’elles de 
manière que : son sommet glisse suivant l’autre parabole, leurs axes 
demeurent parallèles, les paraboles se trouvent dans des plans perpendicu- 
laires et leurs branches soient dirigées dans les sens opposés. Animée de ce 
mouvement, la parabole engendre le paraboloïde hyperbolique (fig. 46). 

La section du paraboloïde hyperbolique par le plan z = a est une 
hyperbole dont l'équation, par rapport au repère {O*, e,, e,} de ce plan 


2 = y = 0. 
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Fig. 46. AOB — parabole 
immobile, XLM, 
NOP ca GRS — 
différentes posi- 
tions de la para- 
bole mobile 


avec origine au point O*(0, 0, æ), est de la forme 


2 2 
= 2e 
a b 
Pour des grands a positifs, les demi-axes de l’hyperbole V2a a et V2a b sont 
aussi grands, ils diminuent lorsque a décroît. Ceci étant, l’axe transverse de 
l’hyperbole est parallèle au vecteur e, (fig. 47). Pour « = 0, l’hyperbole 
dégénère en un couple de droites sécantes. Si &« < 0, l’axe transverse de 
l’hyperbole devient parallèle au vecteur e,. Les demi-axes augmentent avec 
læl. Le rapport des demi-axes de tous les hyperboles est le même si les 
sont de même signe. Il s'ensuit que les projections, sur un même plan, de 
toutes les sections du paraboloïde hyperbolique forment une famille 
d’hyperboles ayant pour asymptotes le couple de droites sécantes d’équa- 


2 2 
tion L — e = 0 (fig. 48). 


Fig. 48. Projections des sections d'un parabo- 
loïde hyperbolique. Les traits fins correspon- 
dent à œ > 0, les traits forts, à & > 0 
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Fig. 49. 


Tout comme l’hyperboloïde à une nappe, le paraboloïde hyperbolique 
possède deux familles de génératrices rectilignes (fig. 49) dont les équations 
sont de la forme : 


nn 
px :) 


D x ( +2) = x =” = 2) "7. 
a a b 


Ces équations se déduisent de la même façon que les équations des 
génératrices rectilignes de l’hyperboloïde à une nappe. 


2X2Z, 
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CHAPITRE IV 


TRANSFORMATIONS DU PLAN 


S 1. Applications et transformations 


1. Définition. On appelle application f du plan P dans le plan R la rela- 
tion dans laquelle à tout point du plan P est associé un point déterminé du 
plan R. On utilisera la notation f : P — R. S'il est nécessaire d’indiquer 
qu’au point À du plan P correspond un point B du plan R, on écrira B = 
= f(4). On dit que le point B du plan R est l’image de À par l’application f 
et que le point À du plan P est un antécédent ou une image réciproque de B. 

Les applications pour lesquelles les plans P et R se confondent sont 
appelées transformations. On traitera dans ce paragraphe les faits princi- 
paux sur les applications que le lecteur connaît déjà à partir des transfor- 
mations. 

Soulignons que pour les applications, comme pour les transformations, 
on ne suppose pas que tout point du plan R est une image d’un point de P. 
Il se peut que l’ensemble de toutes les images ne coïncide pas avec R. 

2. Exemples. 1) Etant donné deux plans P et R, faisons correspondre à 
chaque point du plan P le pied de la perpendiculaire abaissée de ce point 
sur le plan R. On a ainsi défini une application qu’on appelle projecteur 
orthogonal. Dans cette application, tout point du plan R possède, en géné- 
ral, un antécédent et un seul. Il existe un cas où le projecteur orthogonal 
change brusquement de caractère. A savoir, si les plans P et R sont perpen- 
diculaires, tout point du plan R n’a pas d’antécédent ; seuls les points de la 
droite d’intersection des plans en possèdent. En revanche, chacun de ces 
points a une infinité d’antécédents situés sur la perpendiculaire à R élevée 
en ce point. 

2) La translation, la rotation, la symétrie axiale, l’homothétie, que le 
lecteur connaît déjà, peuvent servir d’exemples de transformations. 

3) Soit la droite p du plan P et soit le nombre À > 0. D'un point arbi- 
traire M non situé sur p abaissons la perpendiculaire sur cette droite et dési- 
gnons son pied par N. Définissons le point f(M) par la relation Nf(M) = 
= ÀNM. Si M est sur p, posons f(M) = M (fig. 50). La transformation 
ainsi définie s’appelle contraction vers la droïite p dans le rapport X. (Si 
À > 1, cette transformation peut être appelée fraction.) 
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M 


MofiM,) N P 


Fig. 50. 


On s’est déjà servi de la contraction vers la droite au $ 1 du ch. III lors 
de l’étude de l’ellipse. Une transformation analogue de l’espace, la contrac- 
tion vers le plan, a été utilisée lors de la définition de la quadrique au $ 4 du 
Ch. III. 

4) Choisissons dans chacun des plans P et R un repère cartésien rectan- 
gulaire et associons à un point de coordonnées x et y dans le plan P un 
point de coordonnées x* = x2 — y2,y* = 2xy dans le plan R. On s’assure 
aisément en résolvant ces équations en x et y que tout point du plan R 
admet deux antécédents dans le plan P, l’origine des coordonnées faisant 
exception car son antécédent est unique. 

5) Etant donné un point ©, associons à tout point M différent de O un 
point f(M) défini par l’égalité 


Arctg |OM où 
OM 


Posons f(O) = ©. Ceci étant, à chaque point du plan est associé un point 
unique situé à l’intérieur du cercle de rayon +x/2 et de centre au point O. 
Chaque point intérieur au cercle admet un antécédent et un seul, tandis que 
les points extérieurs au cercle n’en possèdent pas. 

6) On peut associer à tout point du plan le pied de la perpendiculaire 
abaissée de ce point sur une droite fixée p, et à tout point de la droite ce 
point même. Dans ce cas, à tous les points de la droite perpendiculaire à p 
est associé un même point. 

7) On peut associer à chaque point du plan P un même point dans le 
plan R. 

3. Produit d’applications. Application réciproque. La notion de com- 
posée des transformations est connue dès l’école secondaire. On l’appellera 
produit en la définissant aussi pour les applications. 


OM) = 


DÉFINITION. Soient les applications f : P — R et g : R — S. L’applica- 
tion h associant à tout point À du plan P un point g(f(4)) du plan S est 
appelée produit de l’application f par l’application g et est notée gof. 
L'application qui agit la première figure à droite. 
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Soulignons que pour qu’on puisse définir le produit d’applications, il 
faut que le plan d’arrivée de la première application se confonde avec le 
plan de départ de la seconde application. 

Il va de soi que le produit d’applications, comme celui de transforma- 
tions, dépend de l’ordre des facteurs, c’est-à-dire que gcf n’est pas en 
général égal à f og. Il faut signaler que pour les applications, les deux pro- 
duits ne sont définis simultanément que dans le cas où f: P—Ret 
g:R— P. 

Laissons au lecteur le soin de se convaincre que la composition des 
applications est associative, c’est-à-dire que si le produit (fog)oh est 
défini, il en est de même de f o(g ch), et les deux produits sont égaux. 

Si l’on note e, et e, les transformations identiques des plans P et R, 
toute application f : P — R vérifie foe, = f et e,of = f. Si f est une 
transformation du plan, ces égalités se réduisent à eof = foe = f. 

Par définition de l’application f : P — R, tout point du plan P a une 
image et une seule. Les exemples 4) et 6) montrent qu’un point du plan R 
peut avoir plusieurs antécédents, tandis que dans les exemples S), 6) et 7) 
tout point du plan R n’est pas nécessairement image d’un point de P. 


DÉFINITION. L'application f : P — R est appelée application bijective ou 
bijection du plan P sur le plan R si tout point du plan R est l’image d’un 
point du plan P et d’un seul. 

Les applications mentionnées dans 2), 3) sont bijectives et dans Îles 
exemples 4) à 7) elles ne le sont pas. 

Soit donnée l’application f : P — R. A tout point À du plan Pelle asso- 
cie son image f(4) dans le plan R. Associons maintenant d’une façon réci- 
proque un point À à tout point f(4). Il va de soi qu’une telle relation satis- 
fait à notre définition de l’application si et seulement si tout point du plan 
R est l’image d’un point de P et d’un seul. Cela signifie que l’application f 
doit être bijective. 


DÉFINITION. On appellera application réciproque de l’application bijec- 
tivef : P — Rl’application f-! : R — Ptelle que f-!(f(4)) = À pour tout 
point À du plan P. 

On voit aisément que la définition de l’application réciproque est équi- 
valente à la relation f-!of = e,, où 6, est la transformation identique du 
plan P. 

Deux points confondus possèdent une même image, de sorte que 
f(#-1(#(4))) = f(4) ou f(f-1(B)) = B pour tout point B du plan R. Cela 
signifie, en particulier, que la réciproque de l’application f- ! est l’applica- 
tion f. La condition f(f-1(B)) = B est équivalente à l'égalité fof"1 = e., 
où 6, est la transformation identique du plan R. 

Si f est une transformation bijective du plan, on a 


f-lof = fof-l1 = 0. 
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4. Expression analytique d’une application. Soit donnée une applica- 
tion f: P— R, où Pet R sont deux plans. Par définition, cela signifie 
qu’est donnée une relation dans laquelle à tout point M du plan P est asso- 
ciée son image f (M) dans le plan R. Si l’on choisit dans le plan P un repère 
{O, e,, e,], et dans le plan R un repère {Q, p,, p,}, le point M sera défini par 
le couple de nombres x, y, et le point M* par les nombres x*, y*. Il s’ensuit 
que l’application f fait correspondre à chaque couple de nombres x, y des 
nombres x*, y*. Ainsi donc, étant donné deux repères, définir une applica- 
tion revient à définir deux fonctions dont chacune dépend de deux varia- 
bles indépendantes : 


X* = ex, y),  y* = Y (x, »). (1) 


Ces égalités représentent une expression analytique, c’est-à-dire avec 
emploi des coordonnées, qui a été utilisée dans l’exemple 4) de ce paragra- 
phe. 

Soulignons que dans le cas général, les repères des plans P et R ne sont 
pas liés entre eux : le point Q n’est pas obligé d’être l’image du point O, et 
les vecteurs p, et p, celles des vecteurs e, et e.. 

S’il s’agit d’une transformation, il est tout naturel de choisir un seul 
repère, vu que l’image et son antécédent se trouvent dans le même plan. 

Si les fonctions # et Ÿ sont définies pour tout couple de nombres, les 
formules (1) définissent, dans les repères donnés des plans P et R, une 
application f: P — R. 

Il s'ensuit, en particulier, que l’étude des applications est un problème 
aussi vaste que l’étude des fonctions ou des courbes arbitraires. On s’occu- 
pera donc ici des applications qui forment une classe restreinte et simple 
mais fort importante. Parmi toutes les applications elles se détachent de la 
même façon que les droites parmi toutes les courbes planes. 


$ 2. Applications lineaires 


1. Définition des applications linéaires. Considérons deux plans P et R. 


DÉFINITION. On dit que l’application f : P — R est linéaire s’il existe des 
repères cartésiens dans les plans P et R par rapport auxquels f peut être 
définie par les formules 


x* = a,x + HE 
y* = a,x + b,y + c:. 


(1) 


L'application linéaire bijective est appelée application affine. 

Soulignons que dans la définition de l’application linéaire il n’est pas du 
tout exigé que les coefficients a, et b, ou a, et b, soient simultanément non 
nuls. Les seconds membres des formules (1) sont des polynômes de degré 
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au plus égal à 1. Pour les applications affines ces polynômes sont linéaires 
et vérifient de plus la 


PROPOSITION 1. Pour qu'une application linéaire définie par les formules 
(1) soit bijective il faut et il suffit que 


#£ 0. (2) 


Ainsi, une application affine est définie par les formules (1) à condition que 
(2) soit vérifiée. 


DÉMONSTRATION. Cette assertion découle de la proposition 10 du $ 2, 
Ch. II. En effet, on doit rechercher la condition à laquelle tout point 
M"*{(x*, y*) possède un antécédent unique M(x, y). On obtient les coordon- 
nées du point M en résolvant le système (1). Or ce système possède une 
solution unique, quels que soient les termes constants x* — c, et y* — c., 
si et seulement si est satisfaite la condition (2). 

Voici quelques exemples d’applications et transformations à la fois affi- 
nes et linéaires. 

1) Le projecteur orthogonal (exemple 1 du $ 1) est une application 
linéaire. Pour le démontrer, choisissons dans les plans P et R deux repères 
Cartésiens rectangulaires de manière que la droite d’intersection de ces 
plans soit leur axe des abscisses commun. Dans ce cas, étant donné le pro- 
jecteur orthogonal f : P — R, les points M et f(M) possèdent la même abs- 
cisse, et le rapport de leurs ordonnées est égal au cosinus de l’angle entre les 
plans. Ainsi donc, 


X* = x, y* = ycose. 


L’application est affine si et seulement si les plans ne sont pas perpendicu- 
laires, c’est-à-dire si cosw # 0. 

2) L’homothétie s'écrit le plus aisément dans le repère cartésien dont 
l'origine est le centre d’homothétie O._ Puisque tout vecteur OM se trans- 
forme par homothétie en un vecteur Of(M) = OM, le point M de coor- 
données x, y devient le point f (M) de coordonnées Àx, Ày. Ainsi, l’homo- 
thétie est définie par les égalités 


x* = ÀxX, y* = Ày. 
3) La contraction vers une droite (exemple 3 du $ 1) s’écrit le plus aisé- 
ment dans le repère cartésien rectangulaire dont l’axe des abscisses coïncide 


avec la droite vers laquelle est réalisée la contraction. On constate facile- 
ment que dans ce repère 


x” = X, y* — AY, 


où À est le coefficient de contraction. 
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4) Le projecteur sur une droite (exemple 6 du $ 1) s’écrit le plus aisé- 
ment dans le repère cartésien rectangulaire dont l’axe des abscisses coïncide 
avec cette droite. On a donc dans ce repère, 


X* = x, y* = 0. 


C’est une transformation linéaire mais non pas affine. 

5) L'application associant à tout point du plan P un même point C du 
plan R s’écrit à l’aide des formules x* = c,, y* = c,, où c,, c, sont les 
coordonnées du point C. Cette application est également linéaire mais non 
pas affine. 

La définition de l’application linéaire présente le même défaut que celle 
de la courbe algébrique ; elle dépend du repère, et l’on ne sait pas si l’appli- 
cation linéaire sera définie par les formules (1) dans tout autre couple de 
repères cartésiens. Ce défaut est levé par la proposition suivante. 


PROPOSITION 2. Quels que soient les repères cartésiens dans les plans P et 
R, l'application linéaire Ÿ : P — R est définie par les formules (1). 


DÉMONSTRATION. Supposons que l’application f est donnée par les égali- 
tés (1) dans les repères {O, e,, e,] et {Q, p,, p.] des plans P et R respective- 
ment. Passons aux nouveaux repères {[O”, e,, e,] et {Q’, p,, p;}. Expri- 
mons les anciennes coordonnées d’un point du plan P au moyen des nou- 
velles par les formules 

x = ax + By + y, } 

J aX" + B,y' + 
et dans le plan R, les nouvelles coordonnées au moyen des anciennes par les 
formules 


(3) 


x = ÀX* + pp" + v,, } 

y*° DX* + D)" + nv. 
Il nous faut exprimer les nouvelles coordonnées x*°, y*” du point M* par 
l’intermédiaire des nouvelles coordonnées x', y” du point M. A cet effet, 
portons dans (4) les expressions (1) pour les coordonnées de l’image M* 
définies au moyen des coordonnées de son antécédent M. On obtient les 
nouvelles coordonnées de M* exprimées en fonction des anciennes coor- 
données de M : 


(4) 


x" = À,(a,x + by + ©) + u,(a,x + b,y + ©) + »,, 

}*" = R(a,x + by + ©) + (ax + b,y + c,) + v.. 

Il nous importe que les seconds membres de ces égalités sont des polynômes 

en x et y de degré inférieur ou égal à 1, c’est-à-dire sont de la forme 
x*' = Ax + By + C,, | 


5 
}*" = A,x + B,y + C.. 6) 
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En portant dans (5) les expressions de x et y tirées des formules (3), on 
obtient la relation entre les nouvelles coordonnées de l’image et les nouvel- 
les coordonnées de son antécédent, c’est-à-dire la dépendance cherchée 


X*° = A(ax" + 8,7" + y,) + B(a;,x° + B,y° + y,) + C,, 
+" = A,(ax" + By" + y) + B,(ax" + By + y) + C. 


On voit que les seconds membres de ces égalités sont des polynômes en x” 
et y’ de degré au plus égal à 1, c’est-à-dire que 

x*" = ax +b;y +c,, 

}* = ax +b;y +c. 
Ce qu'il fallait démontrer. 

Signalons que la propriété des applications affines d’être bijectives ne 
dépend pas du choix des repères. Aussi la définition de l’application affine 
ne nécessite-t-elle pas d’arguments supplémentaires. 

2. Produit d’applications linéaires. La démonstration de la proposi- 
tion 2 s’est appuyée sur le fait que le résultat de la substitution de polynô- 
mes de degré au plus égal à 1 dans un polynôme de degré au plus égal à 1 est 
encore un polynôme de degré au plus égal à 1. Le même fait est à la base de 
la proposition suivante. 


PROPOSITION 3. Si le produit des applications linéaires est défini, il est 
une application linéaire. 


DÉMONSTRATION. Soient données les applications linéaires f: P—Ret 
g : R — S. Les plans P, R et S étant rapportés aux repères cartésiens, les 
coordonnées du point f(44) s’expriment en fonction des coordonnées du 
point M par les formules 
x* 
y* 
et les coordonnées du point g(f(M)) se.déterminent en fonction des coor- 
données du point f(M) par les formules 

x** = dx* +ey* + jf, 

y** = dx* +e,y* + f.. 


ax + by +c.,, | & 


a,x + b,y + c;, 


(7) 


La substitution de (6) dans (7) fournit l’expression des coordonnées de 
g(f(M)) au moyen des coordonnées de M : 


x°* = d,(a,x + b,y + c,) + e,(a,x + b,y + ©) + J,, 
y** = d,(a,x + b,y + c,) + e,(a,x + b,y + ©) + j.. 


On voit que les seconds membres sont des polynômes de degré inférieur ou 
égal à 1. Ce qui démontre notre assertion. 
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PROPOSITION4. Le produit des applications affines est une application 
affine. 


Il suffit, en vertu de la proposition 3, de démontrer que le produit des 
applications bijectives est aussi une application bijective. Or ce fait est 
assez évident. En effet, chaque point À du plan S a par l’application 
g : R — Sun antécédent B dans le plan R et un seul, qui, à son tour, admet 
par l’application f : P — R un seul antécédent C dans le plan P. Le point C 
est justement l’antécédent unique du point À par l’application gof. La 
proposition est démontrée. 

Etant une application bijective, toute application affine admet une 
application réciproque. 


PROPOSITIONS. La réciproque de l'application affine est encore une 
application affine. 


Pour le démontrer, il nous faut résoudre l’équation (1) en x et y. Muiti- 
plions la première équation par b, et la seconde par — b, et additionnons- 
les. Il vient 


(a,b, — a,b,)x = b,(x* — c,) — b,C* — c). 


Il ressort de la condition (2) que x est un polynôme linéaire en x* et y*. De 
façon analogue, on obtient l’expression pour y. 

3. Image d’un vecteur par l’application linéaire. Considérons dans le 
plan P un vecteur MM M, et notons (x,, y,) et (x,, y.) les coordonnées des 
points M, et M, par rapport au repère {O, e,, e,}. Le vecteur MM M, a alors 
les composantes (x; — X,, y; — }y,). Supposons que les formules (1) défi- 
nissent une application linéaire f : P — R dans les repères {O, e,, e,] et 
{Q, p,, p.). Dans ce cas, les images M* et MS des points M, et M, ont pour 
abscisses 


X} = 4x, + by, +0, et x? = ax, + by, + c;. 
Il s'ensuit que la première composante du vecteur MM* est 
X3 — XY = 4x, — X,) + b,O, — y). 
De façon analogue, on obtient la seconde composante de MM: : 
V3 PI = 0 — Xi) + b;02 — y). 


Soulignons la circonstance suivante : les composantes de MM ne s’expri- 
ment que par les composantes de M, M, et ne contiennent pas les coordon- 
nées des points M, et M... 

Considérons deux vecteurs égaux dans le plan P. Leurs composantes 
sont identiques et, par suite, l’application linéaire les transforme en vec- 
teurs dont les composantes sont aussi identiques. 
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PROPOSITION 6. Les vecteurs égaux se transforment par l'application 
linéaire en des vecteurs égaux. Les composantes (œ*, x?) de l’image dans la 
base {p,, p,} s'expriment alors en fonction des composantes (x, æ,) de 
l’antécédent dans la base {e,, e,) par les formules 


(8) 


ù — 


a+ 


a,a, + b,a.,. 
Il découle de ces formules que l’application linéaire f vérifie les égalités 
f(a + b) = f(a) + dat 
f(Aa) = Àf(a), 
quels que soient les vecteurs a et b et le nombre a. 
Démontrons d’abord la première des égalités (9). Soient 7} et y; les 
composantes du vecteur f(a + b). Il vient alors 
vi = 4a,(a, + B,) + b,(œ,; + B;), 
> _ a,(a, + B,) + b,(@;, + B;), 
Où (œ,, æ.) et (B,, B,) sont les composantes des vecteurs a et b. D’où 
y = 4,a, + bia, + a, B, + b,B, = 
92 = 40, + b,a, + a,G, + b,p, 


La proposition suivante révèle la signification géométrique des coeffi- 
cients dans les formules (1). 


(9) 


R 
sm. 

+ 
se. 


Il 
R 
s+ 
+ 
TT 
,# 


PROPOSITION 7. Soit une application Î : P — R définie par les formules 
(1) dans les repères {O, e,, e,} et [Q, p,, p.) des plans P et R. Alors (c,, c:) 
sont les coordonnées du point {(O) par rapport au repère {Q, p,, p.}, tandis 
que (a,, a,) et (b,, b,) sont les composantes de f (e,) et f(e,) dans la base {p,, 
p). 

Portons dans (1) les valeurs x = Oet y = 0, autrement dit les coordon- 
nées du point O. On voit que les coordonnées de f(O) sont égales à c, et c. 

Posons @, et æ, de (8) égaux aux composantes de e,, autrement dit 
@, = l,a, = 0. Alors a* = a,, «> = a,. Donc, f(e,) a pour composantes 
a,, a. On démontre de façon analogue que les composantes de f(e,) sont 
égales à b, et b.. 


PROPOSITIONS. Quels que soient trois points non alignés L, M et N du 
plan P et trois points L*, M* et N* du plan ©, il existe une application 
linéaire f et une seule telle que L* = f(L),M* = f(Met N° = f(N). Certe 
application est affine si et seulement si L*, M*et N° ne sont pas alignés. 


DÉMONSTRATION. Les vecteurs LM et LN ne sont pas colinéaires. Donc, 
L, LM, LN forment un repère cartésien dans le plan P. Choisissons dans le 
plan R un repère arbitraire et supposons que c,, c, sont les coordonnées de 
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——p —$ 
L*, et a,, a, et b,, b,, les composantes des vecteurs L*M® et L*N® dans ce 
repère. Les formules 


à — 
x* = ax +by+c, 
y" = ax + b,y + c, 


définissent une application linéaire f : P — R qui, comme on le voit aisé- 
ment, possède la propriété exigée : L* = f(L), M* = f(M, N° = f(N. 
De plus, en vertu de la proposition 7, cette propriété définit d’une façon 
univoque les coefficients intervenant dans les formules ci-dessus. 

La condition (2) qui est une condition nécessaire et suffisante pour 
qu "une application linéaire soit affine est aussi nécessaire et suffisante pour 
que L*M* et L*N® ne soient pas colinéaires, autrement dit pour que L*, 
M” et N° ne soient pas alignés. 


PROPOSITION 9. L'image M* du point M par l'application affine a les 
mêmes coordonnées par rapport au repère [f(O), f(e,), f(e,)} que le point 
M par rapport au repère {O, e,, e.). 


Autrement dit, dans les repères {O, e,, e,] et {f(O), f(e,), f(e.)} l’appli- 
cation affine se définit par les formules x* = x, y* = y. Cette assertion 
découle immédiatement de la proposition 7. 

Choisissons dans les plans P et R deux repères cartésiens quelconques et 
associons à tout point M du plan P un point M* du plan R de mêmes coor- 
données. Cette relation est une application affine définie par les formules 
Xx* = x,y* = y. Il ressort de la proposition 9 que toute application affine 
peut être exprimée de cette manière. 


$S 3. Transformations affines 


1. Transformations orthogonales. Commençons l’étude des transfor- 
mations affines par celles qui sont liées aux déplacements dans le plan. Ici 
et plus loin on les appellera transformations orthogonales. Démontrons 
d’abord que les trois principales transformations orthogonales, à savoir : 
la translation, la rotation et la symétrie axiale, sont des transformations 
affines. 

a) La translation de vecteur c associe à tout point M de coordonnées 
x, y dans un repère cartésien donné un point M* de coordonnées x + c., 
y + c,, où c, et c, sont les composantes de c. Il s'ensuit que 


X°=xX+0C, y*=}+c. (1) 
b) Considérons la rotation d’angle æ du plan autour du point ©. Dans le 


système de coordonnées polaires de pôle O, l’image M* du point M(r, &) 
admet les coordonnées r et & + a. Les formules (3) du $ 2, ch. I, nous per- 
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mettent de passer du système polaire au repère cartésien rectangulaire 
d’origine en O : 


x* = rcos(e + a), }y* = rsin(s + @). 


D'où, selon les formules du cosinus et du sinus de la somme de deux angles, 
il vient 


x* 

y* 

c) Pour exprimer en coordonnées la symétrie axiale, choisissons un 
repère cartésien rectangulaire de façon que son axe des abscisses coïncide 


avec l’axe de symétrie. Tout point M{(x, y) se transforme alors en un point 
M" de coordonnées x, — y. Ainsi donc, pour la symétrie axiale on a 


(2) 


XCOS œ — Ysin a, } 
xSiInœ + ÿYCOsa@. 


Xt= x, Y* = —y. (3) 


Les formules (1), (2) et (3) présentent, dans leurs seconds membres, des 
polynômes linéaires et définissent donc des transformations linéaires. Ces 
transformations sont bijectives, donc affines. 

On définit une transformation orthogonale comme une transformation 
du plan conservant les distances entre les points. On sait qu’elle conserve 
également les angles entre les droites. 

Il en découle que l’image par transformation orthogonale d’un repère 
cartésien rectangulaire {O, e,, e,} est un repère cartésien rectangulaire 
{O*, e*, e;}, et que l’image d’un point M de coordonnées x, y par rapport 
au repère {O, e,, e,} est un point M* de mêmes coordonnées x, y par rap- 
port au repère {O*, e*, e*. Or les relations entre les coordonnées d’un 
même point par rapport à deux repères différents nous sont connues (for- 
mules (7), $ 4, ch. 1). Appliquées au point M", ces formules nous fournis- 
sent l’expression de ses coordonnées x*, y* dans le repère {O, e,, e,} en 
fonction de ses coordonnées x, y dans le repère {O*, e’, e : 


x* 

y* 
Ici (c,, c,) sont les coordonnées du point O*, et # est l’angle des vecteurs e, 
et e; mesuré dans le sens de e, vers e;. 

Rappelons que x, y sont les coordonnées de l’antécédent M. Cela signi- 
fie que les formules (4) peuvent être interprétées comme une expression 
analytique de la transformation orthogonale dans le repère {O, e,,e,). On a 
ainsi démontré la 


XCOSÿ F ysing ML @ 


Xsing + COS + C.. 


PROPOSITION 1. Toute transformation orthogonale est affine et est défi- 
nie dans tout repère cartésien rectangulaire à l’aide des formules (à). 
Cette proposition entraîne la 
8— 6442 
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PROPOSITION 2. Toute transformation orthogonale est le produit d’une 
rotation par une translation et, peut-être, encore par une symétrie axiale. 

En effet, soit une transformation orthogonale définie dans le repère 
cartésien rectangulaire par les formules (4). L'image par symétrie axiale 
d’un point M{(x, y) est un point N{(u, vu), où u = x, vu = —}y si l’axe de 
symétrie coïncide avec l’axe des abscisses de ce repère. La rotation d’angle 
# autour de l’origine des coordonnées transforme le point N en un point 
K(w, z), avec 


UCOSp — vsing = XCOS® + ysiny, 
Z = using + vCOsy = xXsSiNnp — COS. 


Ww 


Enfin, l’image du point K(w, z) par translation de vecteur c(c,, c,) est un 
point M*(w + c,,z + c,) dont les coordonnées s'expriment en fonction 
de x, y par les formules (4), compte tenu des signes + et — inférieurs des 
coefficients affectant y. Si la symétrie axiale n'intervient pas, on obtient les 
formules (4) avec les signes + et — supérieurs. 

On voit que le produit des transformations ainsi construit associe à un 
point arbitraire du plan la même image que la transformation orthogonale 
donnée. La proposition est démontrée. 

Il faut remarquer que la représentation de la transformation orthogo- 
nale sous forme de produit n’est pas univoque. Par ailleurs, il est possible 
de décomposer une rotation ou une translation en produit de symétries 
axiales, et représenter le produit d’une translation par une rotation à l’aide 
d’une rotation unique, etc. Sans entrer dans ces détails proposons-nous de 
dégager la propriété générale suivante de ces décompositions. 


PROPOSITION 3. Quelle que soit la décomposition de la transformation 
orthogonale donnée en produit de rotations, translations et symétries axia- 
les, la parité du nombre de symétries axiales figurant dans la décomposi- 
tion est toujours la même. 


Pour le démontrer, considérons dans le plan une base quelconque et 
étudions la variation de son orientation (sens de la plus petite rotation de e, 
vers e,) par transformation orthogonale. Signalons que la rotation et la 
translation ne modifient l’orientation d’aucune base, tandis que la symétrie 
axiale change l’orientation de toutes les bases. Il en découle que, si la trans- 
formation orthogonale donnée modifie l’orientation d’une base, toute 
décomposition de cette transformation doit comprendre un nombre impair 
de symétries axiales, et par suite, l’orientation de toute autre base doit être 
aussi modifiée. Mais si l'orientation de la base ne change pas, le nombre de 
symétries axiales dans la décomposition ne peut être que pair, et dans ce cas 
l’orientation de toute base demeure inchangée. 
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DÉFINITION. On dit qu’une transformation orthogonale est de première 
espèce si elle peut être décomposée en produit d’une rotation et d’une 
translation ; sinon, on dit qu’elle est de deuxième espèce. 


PROPOSITION 4. Les transformations orthogonales de première espèce se 
déterminent par les formules (4) avec des signes supérieurs des coefficients 
affectant y et ne modifient l'orientation d'aucune base. Les transforma- 
tions orthogonales de deuxième espèce se déterminent par les formules (4) 
avec des signes inférieurs et modifient l'orientation de toute base. 


2. Image de la droite. Dans le texte qui suit, f désigne une transforma- 
tion affine du plan, définie par rapport au repère cartésien {O, e,, e,]} à 
l’aide des formules 


x* = ax +by+c,, | 
(5) 
y" = ax + by +c,, 
à la condition que 
a; ox | 
# (. 
a, b, (6) 


Considérons dans le plan une droite d’équation r = r, + at et cher- 
chons son image par la transformation affine f. Le rayon vecteur de 
l’image M* d’un point arbitraire M de la droite peut être calculé de la façon 
suivante : 


r* = OM" = Of(Ô) + f(O)M* = ce + f(r), 


où c est le vecteur constant Of(Ô), et r le rayon vecteur du point M. En uti- 
lisant les propriétés (9), données au $ 2, des transformations affines, on 
obtient 

r® = 0 + f(r,) + f(a)r. (7) 

L'image par transformation affine d’un vecteur non nul est un vecteur 
non nul, car autrement il existerait deux points différents ayant une même 
image, ce qui est impossible pour une transformation bijective. Par consé- 
quent, f(a) # 0 et l'équation (7) est une équation de la droite. Ainsi donc, 
les images de tous les points de la droite r = r, + af se trouvent sur la 
droite (7). 

Notons que la transformation f engendre une bijection entre les points 
des deux droites. Etant donné un point initial et un vecteur directeur sur 
chacune d’elles, l’image du point M admet sur la droite (7) la même valeur 
du paramètre ? que le point M sur la droite initiale. D’où la 


PROPOSITIONS. L'image par transformation affine d’une droite est une 
droite, celle d’un segment est un segment, et les images de deux droites 
parallèles sont deux droïtes parallèles. 
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Pour démontrer que tout segment se transforme en un segment, signa- 
lons que le segment de droite est composé de points dont les valeurs du 
paramètre ! vérifient la double inégalité , < 1 < £,. La troisième assertion 
de la proposition découle du fait qu’en vertu des formules (9), $ 2, les vec- 
teurs colinéaires se transforment en des vecteurs colinéaires. 


PROPOSITION 6. La transformation affine ne change pas le rapport des 
longueurs de deux segments parallèles. 


DÉMONSTRATION. Soient deux segments parallèles AB et CD. Cela sigui- 
fie qu'il existe un nombre À tel que AB = XCD, de sorte que les images des 
vecteurs AB et CD sont liées par la même relation A*B* = ÀAC*D*. Ilen 
découle que 

lABI _ l'A*B*I 


= - _— 


ICDI IC*D* 


FAI. 


. COROLLAIRE. Si le point C partage le segment AB dans un rapport X, son 
image C* partage l'image A*B* du segment AB dans le même rapport x. 


3. Variation de l'aire d’une figure par transformation affine. Soit pour 
commencer un parallélogramme quelconque construit sur les vecteurs p et 
q. Choisissons un repère cartésien {O, e,, e,} et désignons par (x,, y) et 
(x;, y.) les composantes de p et q. On peut calculer l’aire du parallélo- 
gramme en se servant des propriétés du produit vectoriel : 


S = Ifp, qll = lfxe, + pie, x,e, + y,e,]l = Ix,y, — y,x,l l[e,, e,]l. 
Admettons que la transformation affine f rapportée au repère choisi est 
définie par les formules (5). Il ressort de la proposition 7 du $ 2 que f(e,) = 
= ae, + a,e, et f(e,) = be, + b.e,. Selon la proposition 9 du $ 2, les 
vecteurs f(p) et f(q) rapportés à la base [f(e,), f(e,)} possèdent les mêmes 
composantes (x,, y.) et (x,, y.) que les vecteurs p et q rapportés à la base {e,, 
e,}. L'image du parallélogramme est construite sur les vecteurs f(p) et f(a) 
et son aire est 


S* = 1[f(p), f(Q)ll = Ix;y, — x;y,l ITf(e,), f(e,)]l = 
= [xy, — x,y,l l[ae, + a.e,, be, + b.e,]l = 
= 1x y, — x,y,l lab, — a,b,llfe,,e.]l. 
D'où en définitive, 
S*/S = la,b, — a,b.l. (8) 
Cette expression montre que le rapport des aires S* et S est le même pour 


tous les parallélogrammes et ne dépend pas du repère dans lequel la trans- 
formation est définie, bien que dans son expression la,b, — a,b,l figurent 
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les coefficients dépendant du repère. Ce rapport est un invariant (voir 
p. 49) traduisant la propriété géométrique de la transformation. 


Soit x, Y — X:Y, > 0. Alors, comme on l’a vu au point 8 du $ 3, ch. I, les couples des 
vecteurs p, q et e,, e, ont une même orientation, et il en est de même des couples f(p), f(q) et 
f(e,), f(e,). Par conséquent, si la transformation affine change l'orientation des vecteurs de 
base, elle change celle du couple p, q. On démontre de façon analogue que la transformation 
affine change l'orientation de tout couple dont l'orientation est opposée à celle du couple des 
vecteurs de base. 

Mais si l'orientation de la base reste inchangée par transformation affine, il en est de 
même pour les autres couples ordonnés de vecteurs. 

Cette propriété ne dépend évidemment pas du choix du couple de vecteurs de base : ou 
bien l'orientation change pour tous les couples de vecteurs, ou bien elle ne change pour aucun 
d'eux. On a déjà démontré cette propriété pour les transformations orthogonales. 

Signalons maintenant que le couple des vecteurs f(e, ), f(e,) est orienté de la même façon 
que e,, e, si et seulement si a b, — a,b, > 0. On en conclut que non seulement le module du 
déterminant a, b, — a,b, mais aussi son signe ne dépendent pas du choix du repère. On peut 
donc affirmer que a b, — a,b; est un invariant lié à la transformation affine et dont la signifi- 
cation géométrique est le rapport des aires de deux parallélogrammes orientés, où le premier 
parallélogramme est l’image du second par transformation affine étudiée. 

Passons maintenant aux aires d’autres figures. Tout triangle peut être 
complété jusqu’à un parallélogramme dont l’aire est le double de celle du 
triangle. Il en ressort que le rapport de l’aire de l’image du triangle à celle 
du triangle donné vérifie l’égalité (8). 

Tout polygone peut être subdivisé en triangles. Donc, la formule (8) est 
également vraie pour les aires de polygones quelconques. 

On ne touchera pas ici à la définition de l’aire des figures curvilignes. 
Indiquons seulement que dans les cas où cette aire est définie, elle est égale 
à la limite des aires d’une suite de polygones inscrits dans la figure considé- 
rée. La théorie de la limite dit que : si une suite de $, converge vers S, la 
suite de ôS,, où ô est une constante, converge vers ôS. En s’appuyant sur 
cette proposition, on peut conclure que la formule (8) reste vraie dans le cas 
le plus général. 

A titre d'exemple, cherchons l’aire de l’ellipse en fonction de ses demi- 
axes. On a démontré dans le 8 2 du ch. II que l’ellipse de demi-axes a et b 
peut être obtenue par contraction du cercle de rayon a vers une droite pas- 
sant par son centre. Le coefficient de contraction est b/a. Ceci étant, un 
carré de côté 1 et dont la base est située sur la droite mentionnée se trans- 
forme évidemment en un rectangle de côtés b/a et 1. Donc, le rapport de 
l’aire de l’image du carré à l’aire de ce carré vaut b/a. Or on a vu que la 
transformation affine modifie les aires de toutes les figures dans le même 
rapport. Aussi a-t-on pour l’aire de l’ellipse 


S = (xa?)(b/a). 
S = xab. 


D'où il vient 
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4. Images des coniques. On a vu qu’une droite se transformait en une 
droite. Ce fait peut être généralisé par la proposition suivante. 


PROPOSITION 7. L'image par transformation affine d'une courbe algébri- 
que est une courbe algébrique de même ordre. 


En effet, soit la courbe L définie dans le repère cartésien [O, e,, e,) par 
une équation algébrique de degré p. Selon la proposition 9 du $ 2, les ima- 
ges par la transformation affine f de tous les points de la courbe L possè- 
dent dans le repère [f(O), f(e,), f(e,)} les mêmes coordonnées que leurs 
antécédents dans le repère {O, e,, e,). Par conséquent, les coordonnées des 
images dans le repère {f(O), f(e,), f(e,)} sont liées par la même équation 
algébrique de degré p. Cela signifie que l’image de la courbe L est définie 
dans le repère cartésien [f(O), f(e,), f(e,)} par l’équation algébrique de 
degré p. L’image de la courbe L est donc une courbe algébrique de même 
ordre que la courbe Z. 

Il résulte, en particulier, de la proposition 7 que l’image par transfor- 
mation affine de toute conique est une conique. On démontrera une asser- 
tion plus forte, à savoir : toute transformation affine laisse invariante cha- 
cune des sept classes en lesquelles, selon le théorème 1 du $ 1,ch.III,ona 
réparti les coniques. C’est pourquoi, les classes des coniques du théorème 
sont dites a/ffines. Plus précisément, on a la 


PROPOSITION 8. L'image par toute transformation affine de chaque coni- 
que d’une classe affine donnée est encore une conique de cette classe. Par 
ailleurs, à chaque conique on peut associer, par une transformation affine 
appropriée, toute autre conique de la même classe. 


DÉMONSTRATION. On dit que la conique est bornée s’il existe un parallé- 
logramme qui la contient. On constate aisément que dans une transforma- 
tion affine, l’image de toute conique bornée est une conique bornée et celle 
d’une conique non bornée est non bornée. 

1) L’ellipse est une conique bornée. Outre les ellipses ne sont bornées 
que les coniques composées d’un seul point et appelées couples de droites 
sécantes imaginaires. Puisque l’ellipse est bornée et se compose de plus 
d’un point, son image par toute transformation affine est une ellipse. 

2) L’hyperbole comprend deux branches séparées. Cette propriété peut 
être formulée de manière que son invariabilité par transformation affine 
devienne évidente. Plus précisément, il existe une droite qui ne coupe pas 
l’hyperbole mais coupe plusieurs de ses cordes (c’est-à-dire que les points 
de l’hyperbole se trouvent de part et d’autre de cette droite). 

De toutes les coniques, seules les hyperboles et les couples de droites 
parallèles sont composées de deux branches. Les branches de l’hyperbole 
ne sont pas des droites et, par suite, l’image par transformation affine 
d’une hyperbole n’est qu’une hyperbole. 
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3) La parabole est une conique non bornée composée d’une seule bran- 
che curviligne. Aucune autre conique ne possède cette propriété, aussi 
l’image par transformation affine d’une parabole n'est-elle qu’une para- 
bole. 

4) Si une conique représente un point (couple de droites sécantes imagi- 
naires), une droite (couple de droites confondues), un couple de droites 
sécantes ou parallèles, les propriétés déjà démontrées des transformations 
affines entraînent que son image ne peut appartenir à aucune autre classe 
affine. 

Démontrons maintenant que pour tout couple de coniques d’une même 
classe affine il existe une transformation affine dans laquelle l’une des 
coniques est l’image de l’autre. Pour le faire, remarquons que dans le théo- 
rème 1 du $ 1, ch. III, les équations canoniques sont rapportées à un repère 
cartésien rectangulaire et contiennent les paramètres a, b, … Donc, chaque 
équation citée dans le théorème représente en fait un ensemble d'équations 
correspondant à différentes valeurs des paramètres. Si l’on cesse d’exiger 
que la base soit orthonormée, tout cet ensemble peut être réduit à la même 
forme canonique démunie de paramètres. Par exemple, le changement de 
coordonnées x° = x/a, y = y/b transforme l’équation de l’ellipse 
xX?/a? + y?/b? = lenx'? + y’? = 1 quels que soient a et b. (La dernière 
équation n’est pas celle d’un cercle car le repère cartésien n’est plus rectan- 
gulaire.) Le lecteur montrera aisément que pour toute équation du second 
degré il existe un repère cartésien dans lequel cette équation prend l’une des 
formes suivantes : 


1)x2 + y = 1, 2)x2 + y = —1, 3)x? — y? = 1, 
4)x° — y? = 0, 5) x? + y? = 0, 6) y* = 2x, 
D —-1-0, 8) y? + 1 = 0, 9) y? = 0 


Un tel repère sera appelé repère canonique affine. 

Il ressort de la proposition 9 du $ 2 que si une transformation affine fait 
coïncider les repères canoniques affines de deux courbes d’une même 
classe, il en est de même de ces courbes. La proposition est ainsi complète- 
ment démontrée. 


ProPosiTion 9. Pour tout couple de coniques d’une même classe affine, 
dont les équations canoniques présentent les mêmes valeurs de paramètres, 
il existe une transformation orthogonale qui les fait coïncider. 


En effet, la transformation orthogonale les faisant coïncider est celle 
qui confond leurs repères canoniques rectangulaires. 

S. Description de toutes les transformations affines. On a vu à quel 
point une transformation affine peut modifier toutes les figures : un cercle 
peut passer à une ellipse, un triangle équilatérale à un triangle quelconque. 
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Il semble qu'aucun angle n’est alors invariant. Or il s’avère de façon inat- 
tendue qu’on a la 


PROPOSITION 10. Dans toute transformation affine il existe deux droites 
perpendiculaires auxquelles correspondent deux droites perpendiculaires. 


Pour le démontrer, considérons un cercle quelconque. II passe par une 
transformation affine étudiée à une ellipse. Chaque axe de symétrie de 
l’ellipse est un ensemble des milieux des cordes parallèles à l’autre axe. On 
sait que dans une transformation affine l’image d’une corde est encore une 
corde, que les images de deux cordes parallèles sont aussi parallèles et que 
le milieu de la corde redevient son milieu (proposition 5). Aussi les antécé- 
dents des axes de symétrie de l’ellipse sont-ils des segments ayant la même 
propriété : chacun d’eux est un ensemble des milieux des cordes du cercle 
qui sont parallèles à l’autre segment. Ces segments sont nécessairement 
deux diamètres perpendiculaires du cercle. Ainsi donc, la proposition est 
démontrée : il existe deux diamètres perpendiculaires du cercle dont les 
images sont deux segments perpendiculaires : les axes de symétrie de 
l’ellipse. 

Cette proposition nous permet de décrire toutes les transformations 
affines. : 


THÉORÈME 1. Toute transformation affine est le produit d’une transfor- 
mation orthogonale et de deux contractions vers les droites perpendiculai- 
res. 


DÉMONSTRATION. Notons e, et e, deux vecteurs perpendiculaires dont les 
images par une transformation affine f sont des vecteurs perpendiculaires. 
Ces vecteurs existent, selon la proposition 10. Considérons un point arbi- 
traire O et le repère {O, e,, e,}. L'image de ce repère par f est le repère 
{f(O), f(e,), f(e,)} (fig. 51). A l’aide d’une transformation orthogonale g 
on peut associer au point © le point f(O), ainsi que faire coïncider les direc- 
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tions des vecteurs de base e, et e, avec les directions de leurs images, c’est-à- 
dire choisir g de manière que 
g(O) = f(O), À,g(e,) = f(e,), xg(e,) = f(e,), 
À, À > 0. 
Soit h, la contraction dans le rapport À, vers la droite passant par f(O) 


en direction du vecteur f(e,). Cette contraction transforme g{e,) en f(e,) 
sans changer ni le point f(O) ni le vecteur g{(e.) : 


h,og(e,) = f(e,), h,°g(0) = f(O), h, ge.) = g(e.). 


Soit h, la contraction dans le rapport X, vers la droite passant par f(O) 
en direction du vecteur f(e,). Elle transforme ge.) en f(e,) et ne modifie 
pas le point f(O) et le vecteur f(e,). Donc 


h,oh,°g(0) = f(0), h,oh,og(e,) = f(e,), 
h,oh,ogle,) = f(e.). 
On voit que les transformations h, oh, cg et f associent le même repère 
au repère {O, e,, e,). On sait de la proposition 8 du $ 2 qu’une transforma- 
tion affine est entièrement définie par l’image d’un repère cartésien. Aussi 


les transformations affines f et h, oh, cg coïncident-lles et le théorème est 
démontré. 


CHAPITRE V 


SYSTÈMES D’ÉQUATIONS LINÉAIRES 
ET MATRICES 


$ 1. Matrices 


1. Définition. On appelle matrice à m lignes et n colonnes, ou matrice 


de type (m, n), un ensemble de mn nombres rangés en tableau à m lignes et 
n colonnes : 


d, @) «+ ‘0 
a à … à 
aq æœ … æ 


Les nombres intervenant dans la matrice sont appelés éléments de la 
matrice. Si le nombre des lignes est égal au nombre des colonnes, la matrice 
est dite carrée, et le nombre des lignes est appelé ordre de la matrice. Les 
autres matrices sont dénommées rectangulaires. 

Les matrices peuvent aussi être définies de la façon suivante. 

Considérons deux ensembles de nombres entiers : Z = {1, 2, .., m} et 
J = {1,2,...,n}. Notons 7 xJ l’ensemble de tous les couples (i, j), où i est 
un nombre de J et ; un nombre de J. On appelle matrice une application 
définie sur l’ensemble Zx J, c’est-à-dire une relation associant à chaque 
couple (i, j) un nombre a:. 

Deux matrices sont dites égales si elles ont mêmes dimensions et si sont 
égaux leurs éléments homologues. 

En étudiant les matrices, on désignera leurs éléments par des lettres 
affectées de deux indices. Si les deux indices sont inférieurs, le premier dési- 
gne la ligne, le second, la colonne ; si l’un des indices est supérieur, comme 
c’est le cas de la matrice mentionnée ci-dessus, il indique le numéro de la 
ligne. Attention : ne pas confondre cet indice avec un exposant. 

Il est souvent commode d’envisager la matrice comme un ensemble de 
colonnes ou un ensemble de lignes. Soient 


a; 4; 


ar æ a 
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Alors la matrice écrite initialement peut être présentée sous la forme 
la,a, … a, 1. 
De façon analogue, si 
al = al... all, ….,a7 = la. am, 
la même matrice s’écrit sous la forme 


a! 


a" 


2. Addition et multiplication par un nombre. Soient À et B deux matri- 
ces à m lignes et #7 colonnes. On peut leur associer une troisième matrice C à 
m lignes et n colonnes, dont chaque élément est la somme des éléments de 
mêmes indices des matrices À et B. Autrement dit, les éléments c., de la 
matrice C sont liés aux éléments a;; et b;, des matrices À et B par l’égalité 


C; = 4 + b; (1) 
pour tous i = 1, ...,metj = 1,...,n. 


DÉFINITION. La matrice C définie pour À et B par la formule (1) est 
appelée leur somme et est notée À + B. 

Soulignons que la somme n’est définie que pour des matrices de mêmes 
type. 

La définition de la somme des matrices correspond entièrement à celle 
de la somme des fonctions : sont additionnées des valeurs correspondant à 
un même élément de l’ensemble de définition, c’est-à-dire à un même cou- 
ple (4, J). 


DÉFINITION. La matrice C dont les éléments C;; sont égaux aux produits 
des éléments a;; de la matrice À par le nombre «a s’appelle produit de À par 
æ et se note A. On a 


C; 


= a; (2) 


pour tous i = 1,...,m; 7j = 1, 
Des propriétés d’ addition et de nes des nombres on déduit 
aisément la proposition suivante. 


PROPOSITION 1. Pour toutes matrices À, B et C de même type et tous 
nombres a et B sont vérifiées les égalités 
A+B=B+A, (A+B+C=A4A+(B + O0), 
a(A + B) = «À + aB, (a + B)A = œA + BA, 
(xB)A = æ(BA). | 
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La matrice dont tous les éléments sont nuls est dite nulle. Si O est la 
matrice nulle à "7 lignes et #7 colonnes, on a pour toute matrice À de type 
(m, n) 


A + O = À. 
La matrice (— 1).4 sera appelée matrice opposée à À et notée — 4. Elle 
possède la propriété suivante : 
A + (—À) = O. 
La somme des matrices B et — À s’appelle différence des matrices B et 


A. On la notera B — A. 
3. Transposition des matrices. Soit la matrice 


a, l ..e a, 
a; a, 
A — 000000000000 
du dun 


à m lignes et nr colonnes. On peut lui associer la matrice B à n lignes et m 
colonnes en se conformant à la règle suivante. On écrit les éléments de cha- 
que ligne de la matrice À dans la colonne de la matrice B sans changer leur 
ordre, le numéro de la colonne coïncidant avec celui de Ia ligne. Il est évi- 
dent que dans ce cas la ;-ième ligne de B est composée des mêmes éléments 
pris dans le même ordre que la i-ième colonne de À. La matrice 


a); a; …. di 


a;, .…e Ann 


est dite la sransposée de À et notée ‘4. Le passage de À à ‘A est appelé 
transposition. 

La définition d’une matrice transposée peut être écrite sous la forme de 
mn égalités 

b;=a;;, 

reliant les éléments des matrices À et B pour tous les i = 1, ..., met j = 
=: dl, 53500 

4. Matrices-colonnes et matrices-lignes. La matrice de type (1, n), 
c’est-à-dire la matrice composée d’une seule ligne sera appelée marrice- 
ligne à n éléments. La matrice de type (m1, 1) composée d’une seule colonne 
sera appelée matrice-colonne à m éléments. L’addition des matrices-lignes 
n’est définie que pour des matrices-lignes à même nombre d’éléments. Il en 
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est de même de l’addition des matrices-colonnes, qui n’est définie que pour 
des matrices-colonnes à même nombre d’éléments. Pour ces matrices, 
l’addition et la multiplication par un nombre seront étudiées d’une manière 
plus détaillée. Vu que toutes les propriétés des matrices-lignes et des 
matrices-colonnes sont formulées et démontrées d’une façon analogue, 
seul sera traité le cas des matrices-colonnes. 

Les matrices-colonnes et les matrices-lignes seront notées en caractères 
demi-gras. 


DÉFINITION. La matrice-colonne g est appelée combinaison linéaire des 
matrices-colonnes p,, .…, p,, ayant un même nombre d'éléments s’il existe 
des nombres &,, .…., a, tels que l’on ait 

m 
g= À œP 


K= 1 


ou d’une façon plus détaillée 


q! P\ Pi p}, 
CE Pi Pi Pr 
..…e = A .e ie %Æ ..e Li “ER pi Xn CAC] 
g Pi P3 Pm 


Signalons qu’en vertu des définitions de l’addition et de la multiplication 
par un nombre, cette égalité est équivalente à n égalités numériques 


g' = ap} + œp} + … + ap}, 


q? = ap? + api + … + a, 


On a déjà utilisé l’expression « combinaison linéaire » pour les vecteurs. 
La ressemblance de deux définitions n’est pas seulement formelle. La base 
étant choisie, à tout vecteur on peut faire correspondre une matrice-ligne 
formée des composantes (au nombre de trois) de ce vecteur, et à toute com- 
binaison linéaire des vecteurs une combinaison linéaire des matrices-lignes 
formées des composantes de ces vecteurs. On poursuivra l’analogie entre 
les vecteurs et les matrices-lignes (resp. matrices-colonnes) après avoir 
défini la notion de dépendance linéaire. Désignons par le symbole o la 
matrice-colonne dont tous les éléments sont nuls. 


DÉFINITION. Le système de s matrices-colonnes a,, …, a, de même type 
est dit linéairement indépendant ou libre si l’égalité 


@,4, +. + aa = 0 (3) 
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entraîne a, = a, = … = @, = 0. Dans le cas contraire, c’est-à-dire s’il 
existe s nombres &,, …, «, A en non nuls et vérifiant l’égalité (3), 
le système a,, …, a, dit linéairement dépendant ou lié. 

Les définitions d’ un système de matrices-lignes linéairement dépendant 
et linéairement indépendant sont formulées de façon identique. 

La combinaison linéaire dont tous les coefficients sont nuls est dite #ri- 
viale. Ce terme nous permet de formuler la définition précédente comme 
suit : le système de matrices-colonnes est linéairement dépendant ou lié s’il 
existe une combinaison linéaire non triviale de ces matrices-colonnes qui est 
égale à zéro. Le système de matrices-colonnes est linéairement indépendant 
ou libre si la seule combinaison linéaire triviale de ces matrices-colonnes est 
égale à zéro. 

EXEMPLE. Les matrices-colonnes 


I 0 0 

0 1 Fe (4) 
A ee TE 2e a 0 

0 0 


(dans la matrice-colonne e;, le i-ième élément est 1, les autres éléments étant 
nuls) sont linéairement indépendantes. En effet, l’égalité œ,e, + 
. + ae, = 0 peut être écrite sous la forme 


l 0 
0 ie , 0 
a ||...|l +. + a, [|0O | = ||... = ||... 
0 l a, 0 
Il s’ensuit que a, = ..… = a, = 0. 


Mentionnons quelques propriétés des systèmes liés de matrices- 
colonnes. Les propositions 2, 3, 4 ci-après sont analogues aux propositions 
qui ont été formulées au chapitre I pour les vecteurs, leurs démonstrations 
coïncident avec les démonstrations données dans ce chapitre. 


PROPOSITION 2. Un système de s > 1 matrices-colonnes est lié si et seule- 
ment si l’une au moins des ces matrices-colonnes est une combinaison 
linéaire des autres. 

En effet, supposons que le système est lié. En vertu de la définition, 
l’égalité (3) est vérifiée et l’un au moins de ses coefficients est différent de 
zéro. Posons, pour fixer les idées, que c’est «,. On peut alors écrire l’égalité 
(3) sous la forme 

a = 2a-.….- sa. 
%] æ; 
On en tire que la première matrice-colonne est une combinaison linéaire des 
autres. 
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Inversement, quand une des matrices-colonnes (soit a, pour fixer les 

idées) est une combinaison linéaire des autres, on a a, = B,a, + 

. + B,a,. Si l’on porte tous les termes de cette égalité dans l’un de ses 
membres, on pourra traiter cette relation comme une combinaison linéaire 
non triviale des matrices-colonnes 4,, .., a, qui est égale à zéro. 

Il découle de la démonstration que chaque matrice-colonne intervenant 
avec un coefficient non nul dans la combinaison linéaire qui est égale à zéro 
peut être représentée comme une combinaison linéaire des autres matrices- 
colonnes. 


PROPOSITION 3. Le système de matrices-colonnes est lié s’il contient la 
matrice-colonne nulle. 


En effet, la matrice-colonne nulle représente une combinaison linéaire 
triviale de matrices-colonnes quelconques, de sorte que la démonstration se 
réduit à la proposition 2. 


PROPOSITION 4. Le système des matrices-colonnes a,, …, a, est lié si l’un 
quelconque de ses sous-systèmes est lié. 


Admettons que le système {a,, .…, a} contient des matrices-colonnes 
dont une combinaison linéaire non triviale est égale à zéro. Si on ajoute à 
cette dernière les autres matrices-colonnes avec coefficients nuls, on obtient 
une combinaison linéaire non triviale égale à zéro de toutes les matrices- 
colonnes. | 


PROPOSITIONS. Chaque sous-système d’un système de matrices-colonnes 
libre est libre. 


En effet, dans le cas contraire, on aboutirait à une affirmation qui con- 
tredit la proposition précédente. 


PROPOSITION 6. Si la matrice colonne a est une combinaison linéaire des 
matrices-colonnes aie, elle est aussi une combinaison linéaire de tout 
système de matrices-colonnes qui contient a,, …, a. 


Pour le démontrer, il suffit d'ajouter à la combinaison linéaire donnée 
les matrices-colonnes manquantes avec coefficients nuls. 


PROPOSITION 7. Toute matrice-colonne a à n éléments est une combinai- 
son linéaire des matrices-colonnes e,, ..…, e, introduites à l'aide de la for- 
mule (à). 


Cela se déduit de l’égalite suivante : 


a! ] 0 0 
a 0 ] 

[= a + ol +…+a lol. 
a! 0 1 | 


128 SYSTÈMES D'ÉQUATIONS LINÉAIRES ET MATRICES [CH.V 


Les éléments de la matrice-colonne a sont les coefficients de la combi- 
naison linéaire. 


$ 2. Déterminants 


Dans le chapitre I, on s’est déjà initié à la théorie des déterminants des 
matrices carrées d’ordre 2 et 3. L'objectif de ce paragraphe est de définir et 
d’étudier les déterminants des matrices carrées d’ordre quelconque. Il est 
d’usage dans ce cas de se servir du symbole suivant. 

1. Le symbole Ÿ . En mathématiques, on est souvent obligé de considé- 
rer des sommes d’un grand nombre de termes de forme identique et ne dif- 
férant que par les indices. Pour ces sommes on se sert de la notation sui- 

ñn 
vante. Le symbole y suivi d’une expression munie de l'indice k 
K = 1) 
désigne la somme de ces expressions pour toutes les valeurs de l’indice k de 
l à n, par exemple : 
n n : 
Ya=atat.….+a, Ÿ ab, = à, + .… + a,B,. 

kK =]! K=! 
L'indice £ s’appelle indice de sommation. Il va de soi que pour l’indice de 
sommation on peut utiliser toute autre lettre, par exemple : 


D P, = D P:: 
K = 1 s =! 
Citons quelques règles d'utilisation du symbole Ÿ que le lecteur peut 
vérifier facilement. 


PROPOSITION 1. 1) Le facteur indépendant de l'indice de sommation peut 
être chassé de sous le symbole de sommation : 


n 


D aP, = à Ÿ P,, 


kK=1 k= 1 


2) Z @+0)= À Pet À Q. 


K = 1 K = 1 K =] 


La dernière formule est un cas particulier (77 = 2) de l’assertion sui- 
vante. 
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PROPOSITION 2. Deux symboles de sommation peuvent être permutés, 
c'est-à-dire que 


En effet, les expressions P., intervenant sous les deux symboles de som- 
mation dépendent de deux indices et peuvent être écrites sous forme de 
matrice à 7 lignes et nr colonnes. Chacun des deux membres de l’égalité à 
démontrer est la somme de tous les éléments de la matrice : dans le premier 
membre, on additionne d’abord les éléments de chaque ligne et puis on cal- 
cule la somme des résultats obtenus, tandis que dans le second membre, on 
calcule d’abord la somme des éléments de chaque colonne et ensuite on 


n n 
additionne les sommes obtenues. La somme double Ÿ  Ÿ P, est notée 
im] K=1 


n 


D) P., si les deux indices parcourent les mêmes valeurs 1, .., nñ. 
ik mi 


L’application successive de la proposition 2 permet de démontrer que la 
somme multiple 


P 
1-4. 
est indépendante de l’ordre des symboles de sommation. Une telle somme 


est notée 
D Pas 
À 
si tous les indices parcourent les mêmes valeurs. 


Parfois, il nous faudra écrire la somme de tous les termes à l’exception 
d’un terme ou deux. S’il manque un seul terme d’indice ;, on écrira : 


Y P, et, s’il manque deux termes d’indices j et j, on écrira Ÿ P,. 
k # j kei,j 
2. Définition du déterminant. Les déterminants ne sont définis que 
pour les matrices carrées. Le déterminant d’une matrice carrée est un nom- 


bre qui lui est associé et qui peut être calculé d’après ses nn en se réfé- 
rant à la définition suivante. 


DÉFINITION. 1) On appelle déterminant de la matrice d’ordre 1 l’élément 
de cette matrice. 


9—6442 
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2) On appelle déterminant de la matrice 


dj, An ah 
A = las ess ee 
a,; dy dun 
d'ordre n > 1 le nombre 
det À = y (—1)f*tla, M}, (1) 
kK =) 


où M est le déterminant de la matrice 4} d’ordre n — 1 obtenue à partir 
de À en éliminant la première ligne et la £-ième colonne. 

Pour désigner le déterminant de la matrice 4, on utilise la notation 
det À ou, s’il est nécessaire d’écrire les éléments de la matrice, on les enca- 
dre de simples traits verticaux : 


A première vue, la définition du déterminant peut sembler peu effi- 
cace : en effet, on définit le déterminant de la matrice d’ordre n par l’inter- 
médiaire des déterminants d’ordre ñn — 1, sans les avoir défini. Mais en 
réalité, il n’y a rien de gênant. Pour déterminer les nombres A1 on peut se 
servir de la même formule puisqu’elle joue pour les matrices de tout ordre. 
On exprimera alors det À au moyen des déterminants d’ordre ñn — 2. En 
continuant le processus, on peut donc arriver à des matrices d’ordre 1 dont 
le déterminant est défini directement. 

Appliquons notre définition aux matrices d’ordre 2 et 3. Pour la 


matrice 
dj, An 
dy An 
on a Mi = a,,, Mi = a,,, et par suite, 


a a 
11 121 — : 
| = 4j,4> — djd;. 


dy  dp 
Pour la matrice 
dj A) 43 


dy y y 
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il vient évidemment 


a, ga a, a a, a 
_ [y y _ [41 A3 _ [dy A 
Me é a. |” Me h a, |’ Me wi a | 
32 y 31 3 31 y 
et 
det À = a,, 2 °5| : 721 ca) + a,l°2 cal. 
dy y dy dy dy y 


Ces formules coïncident avec la définition des déterminants d’ordre 2 et 3, 
introduite au chapitre I. 
Calculons à titre d’exemple le déterminant de la matrice 


1 0 O0 … 0 
0 1 O … 0 
PE 
0 0 O0 … 1 


appelée matrice unité. Pour cette matrice on a M1 = detE,_,,où E,_, est 
la matrice unité d'ordre n—1, et a, = 0 si À # 1. Par conséquent, 
detE, = detÆE,_,. En appliquant cette égalité n—1 fois, on obtient 
detE, = detE, = 

Le nombre Mi est appelé mineur de l'élément a,,. Par analogie, on 
définit le mineur d’ un élément quelconque a; comme le déterminant d’une 
matrice A obtenue à partir de la matrice initiale A en supprimant la ligne et 
la colonne à l’intersection desquelles se trouve l’élément a.., c’est-à-dire en 
supprimant la i-ième ligne et la j-ième colonne. Notons M le mineur de 
l’élément a. On parle souvent des lignes et des colonnes du mineur ayant 
en vue les lien et les colonnes de la matrice A. On se permettra cette 
liberté de langage car elle ne peut nous induire en erreur. 

3. Propriétés des déterminants. Démontrons par récurrence les asser- 
tions suivantes. 


PROPOSITION3. Pour toute matrice À d'ordre n on a la formule 


det À = » (—1)'*la, M. (2) 
i=! 
Cette formule est appelée développement du déterminant suivant la pre- 
mière colonne. 


DÉMONSTRATION. Il est évident que pour les matrices d’ordre 2 la for- 
mule est vérifiée. Admettons que l’assertion est vraie pour les matrices 
d’ordre 7 — 1 et démontrons qu'elle l’est pour toute matrice d’ordre n. 
Pour le faire, écrivons la formule (1) pour le déterminant de la matrice 


9* 
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d’ordre ñn en dégageant le premier terme de la somme : 


det À = a, M1 + Ÿ (—-1)*la, M. 


ks=2 


Pour tout # > 2, la matrice A! comprend la première colonne (sans son 
premier élément) de la matrice 4. En se servant de l’hypothèse de récur- 
rence, on peut développer M1 suivant cette colonne. Il faut seulement avoir 
en vue que la i-ième ligne de la matrice À devient la (i— 1)-ième ligne de la 
matrice 41 puisque A} ne contient pas la première ligne de la matrice À. Si 
donc £ > 2,ona 


Mi = Z Cam. 
i=2 
où Mi est le déterminant d’une matrice d’ordre n—2 déduite de A! par 
suppression de la (/— 1)-ième ligne et de la première colonne ou, ce qui 
revient au même, déduite de À par suppression de la première et de la 
i-1ème ligne, et de la première et de la k-ième colonne. 
En portant l’expression de M1 obtenue on a 


det À = a,, M1 + y fC-nés1a, D (— l)'a, Mi }: 
K=2 is2 
Faisons entrer le facteur indépendant de ÿi sous le deuxième symbole de 
sommation : 


det A = a,Mi+ Ÿ  YŸ (—1X*i#la, a, Mi. 
K= 2 im? 


Modifions l’ordre de sommation et chassons de facteur indépendant de k 
de sous le symbole de sommation : 


n 


det À = a,Mi + Y [c-1)+10, y Yan Mi |. (3) 


i=2 K=2 


Il n’est pas difficile de remarquer que la seconde somme est, par définition 
du déterminant, égale au mineur Mi. En effet, 


M = L CaiMe, 
K=2 


car la matrice 4!, dont le déterminant est Mi, ne renferme pas la première 
colonne de la matrice À et, de ce fait, tous les numéros des colonnes sont 
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décalés de 1. On peut maintenant écrire (3) sous la forme 


det A = a,Mi + Ÿ {(—-1)*!a, Mi). 


1-2 


L'expression obtenue coïncide avec l'égalité (2) qu’on s’est proposée de 
démontrer. 


PROPOSITION 4. Pour toute matrice carrée, det A = det'A. 

Démontrons cette proposition par récurrence. Elle est évidente pour les 
matrices d’ordre 1. Admettons que la proposition est vraie pour les matri- 
ces d’ordre n— 1 et démontrons-la pour les matrices d'ordre nr. Soient A; la 
matrice déduite de À par suppression de la première ligne et de la j-ième 
colonne, et B/ la matrice obtenue à partir de‘ À par suppression de la j-ième 
ligne et de la première colonne. On voit immédiatement que B, = 'A;. Il 
ressort donc de l’hypothèse de récurrence que det B/ = det 4!, ou bien que 
le mineur associé à l’élément a; de la matrice À est égal au mineur associé à 
l'élément b,, de la matrice "4. Or a; = b;,. Donc, le développement de 
det À suivant la première ligne coïncide avec le développement de det ‘A 
suivant la première colonne. 

De la proposition 4 résulte l’équivalence des lignes et des colonnes 
d’une matrice carrée. Plus précisément, toute assertion sur les déterminants 
des matrices qui est vraie pour les lignes est aussi vraie pour les colonnes, et 
inversement. En vertu de ce fait, il suffit de démontrer les propositions qui 
suivent pour les lignes seulement. 


PROPOSITIONS. Si l'on permute deux lignes (ou deux colonnes) quelcon- 
ques dans une matrice carrée, son déterminant change de signe en gardant 
la valeur absolue. 


Démontrons cette assertion par récurrence en supposant que l’on per- 
mute deux lignes voisines de la matrice. Pour les matrices d’ordre 2 elle se 
vérifie directement. Admettons que l’assertion est vraie pour les matrices 
d’ordre 7-1 et démontrons qu’elle est encore vraie pour les matrices 
d'ordre n. 

Supposons que les numéros des lignes permutées sont £ et £ + 1. Ecri- 
vons le développement du déterminant suivant la première colonne en y 
dégageant deux termes correspondant aux lignes permutées : 


det A = (—1X+1a,, MX + (—1X+2a,,, ,Métl+ Y  (—-1}tla Mi. 


itk.k+1 


Procedons de façon analogue avec la matrice B déduite de À par permuta- 


134 SYSTÈMES D'ÉQUATIONS LINÉAIRES ET MATRICES [CH.V 


tion des lignes de numéros & et &k + 1 : 
det B = (—1YX+!a,,, , M + (—1X+2a,, M+1 + y (—1}+!a, M. 


itk.k+] 


Pour i #4 K,K + 1,1les matrices de déterminants M et Ni contiennent 
les lignes de numéros & et k + 1, écrites dans l’ordre différent, les autres 
lignes étant les mêmes. Par hypothèse de récurrence on a donc M = —M1, 
avecitk,k + 1. 

Les matrices dont les déterminants sont notés M* et Mf+! coïncident : 
on les obtient en supprimant la (& + 1)-ième ligne de la matrice B ou, ce 
qui revient au même, la k-ième ligne de la matrice 4. Donc, M* = M+1. 
De façon analogue, Mf*+! = N%. En comparant maintenant det 4 et det B, 
on voit qu'ils sont égaux en valeur absolue mais qu’ils ont des signes oppo- 
sés. 

Supposons maintenant que dans la matrice À d'ordre 7 on permute les 
lignes des numéros ji et j, et soit pour fixer les idées ; < j. Entre la i-ième et 
la j-ième lignes on a alors /—i—1 lignes. La permutation des i-ième et 
j-ième lignes ne s'effectue qu’avec les lignes voisines : on permute d’abord 
la j-ième ligne avec chacune des ;— ; lignes situées au-dessus (dont la der- 
nière est la i-ième) ; ensuite on fait passer la i-ième ligne à la place de la 
j-ième en la permutant avec chacune des j/ —i— 1 lignes situées au-dessous 
d'elle. On réalisera ainsi un nombre impair de permutations de lignes voisi- 
nes, soit 2(/ — i) — 1. Puisqu’avec chaque permutation le déterminant 
change de signe, il doit aussi modifier son signe avec la permutation des 
i-1ème et /-ième lignes. 

La propriété exprimée par la proposition S est appelée antisymétrie du 
déterminant par rapport aux lignes (resp. colonnes). 

En utilisant la propriété d’antisymétrie par rapport aux lignes et aux 
colonnes, on est en mesure de démontrer que le déterminant peut être déve- 
loppé suivant toute ligne et toute colonne. 


THÉORÈME 1. Toute matrice À d'ordre n vérifie pour touti,1<i< n, 
la formule 


det A = Y (—1X+*'a,Mf (4) 
K=l! 
et pour tout j, 1 < j < n, la formule 
det À = D (— 1X*/a, Mi. (5) 
K =] 


Signalons que pour i = 1 la formule (4) devient la définition du déter- 
minant, et que pour / = 1 la formule (5) coïncide avec le développement 
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(2) suivant la première colonne. Démontrons la formule (4) quand i > 2. A 
cet effet, transposons la i-ième ligne à la première place, de manière à ne 
pas déranger l’ordre des autres lignes. On le fera par des permutations suc- 
cessives de la i-ième ligne avec toutes les lignes situées au-dessus d'elle. Le 
nombre de ces lignes étant ; — 1, on a det À = (—1)/-! det B, où B est la 
matrice résultant de cette permutation. En développant det B suivant la 
première ligne (la i-ième ligne de la matrice A), on obtient 


det A = (—1ÿ-! Y (—1X+'a,M, 


K= 1! 


où N! est le déterminant de la matrice déduite de B par suppression de la 
première ligne et de la k-ième colonne ou, ce qui revient au même, déduite 
de À par suppression de la i-ième ligne et de la k-ième colonne. Donc, 
N} = M, ce qui démontre le développement (4). 

La formule (5) peut être obtenue de la même façon par développement 
suivant la première colonne. 


PROPOSITION 6. Si la i-ième colonne (resp. ligne) de la matrice À est une 
combinaison linéaire des matrices-colonnes (resp. matrices-lignes) p et q, 
autrement dit est de la forme ap + Bq,on a 


det À = a det À, + BdetAÀ,, 


ou les matrices À pt A, sont déduites de À par substitution respective de p 
et de q à la i-ième colonne (resp. ligne). 

Pour le démontrer, il suffit de signaler qu’en vertu de la définition des 
Opérations sur les matrices-colonnes on a pour tous les & (1 < k < n) 
l'égalité a,, = ap* + Bq*, où p* et g* désignent les éléments des matrices- 
colonnes p et g. En portant ces égalités dans le développement de det À sui- 
vant la ;-ième colonne, on obtient 


det À = ) (—1}X+'a,, M? = 
km! 
= à y (— 1} + p£ ME + B y (—1YX+ig£ M, 


kK=] K= 1 


ce qu'il fallait démontrer. 

La propriété exprimée par cette proposition porte le nom de /inéarité du 
déterminant par rapport à une colonne (resp. ligne). On peut évidemment 
représenter det À de façon analogue dans le cas où l’une des colonnes de la 
matrice À est la combinaison linéaire œ,p, + .. + a,p.. 

La linéarité du déterminant par rapport à ses colonnes est parfois for- 
mulée sous forme de deux propriétés : 
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1) Si une colonne de la matrice est multipliée par un nombre, son déter- 
minant est aussi multiplié par ce nombre. 

2) Si une colonne de la matrice est la somme de deux colonnes, son 
déterminant est la somme des déterminants des matrices respectives. 


PROPOSITION 7. Si dans la matrice À les colonnes (ou les lignes) sont 
linéairement dépendantes, det A = 0. 

Signalons que si la matrice comporte une colonne (ou une ligne) nulle, 
son déterminant est nul. Cela résulte du développement suivant la colonne 
(resp. ligne). Admettons maintenant que la matrice ne comporte pas de 
colonne nulle. 

Selon la proposition 2 du $ 1, l’assertion à démontrer peut être formu- 
lée d’une autre manière : si une des colonnes (resp. lignes) de la matrice À 
est une combinaison linéaire des autres colonnes (resp. lignes), det À = 0. 
Démontrons cette proposition. Partons d’un cas particulier. 

Si À comporte deux colonnes identiques, leur permutation ne modifie 
pas la matrice, mais change le signe de son déterminant. Donc, det 4 = 0. 

Admettons maintenant que la j-ième colonne a; est une combinaison 


linéaire des autres colonnes : 4, = Ÿ a,a,. (Certains coefficients a, 
K + j 

peuvent être nuls, c’est-à-dire que toutes les colonnes ne doivent pas forcé- 

ment figurer dans cette combinaison linéaire.) En appliquant la propriété 


de linéarité par rapport aux colonnes, on a det 4 = y a, det À, , où A, 
ke j 

est la matrice déduite de À par substitution de la k-ième colonne à la 
j-ième. Dans cette matrice, la colonne a, se répète deux fois ; donc 
det À, = 0 et la proposition est démontrée. 

4. “Transformations élémentaires. Calcul des déterminants. Le calcul 
des déterminants fait introduire et appliquer pour la première fois une 
notion importante de transformation élémentaire d’une matrice. 


DÉFINITION. On appelle transformations élémentaires d’une matrice les 
transformations suivantes : 

1) multiplication des éléments d’une ligne par un nombre non nul ; 

2) addition d’une ligne à une autre ligne ; 

3) permutation des lignes ; 

4) mêmes transformations appliquées aux colonnes. 

En combinant les transformations élémentaires de la première et de la 
deuxième forme, on est en mesure d’ajouter à toute ligne la combinaison 
linéaire des autres lignes. 


PROPOSITIONS. Le déterminant d'une matrice ne varie pas si à l’une quel- 
conque de ses lignes (resp. colonnes) on ajoute la combinaison linéaire des 
autres lignes (resp. colonnes). 
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Pour démontrer cette assertion, il faut appliquer la propriété de linéa- 
rité du déterminant par rapport aux lignes et tenir compte du fait que le 
déterminant dont les lignes sont linéairement dépendantes est nul. 

Le déterminant de la matrice À peut être calculé ainsi. Si tous les élé- 
ments de sa première colonne sont nuls, det À = 0. Mais si la première 
colonne contient des éléments non nuls, on choisit l’un d’eux (par exemple, 
le plus grand en valeur absolue). Posons que c’est a,,. A chaque ligne, à 
l'exception de la k-ième, on ajoute la £-ième ligne multipliée par — a, /a,,, 
où a;, est le premier élément de la ligne subissant la transformation. Ainsi, 
dans la première colonne de la matrice transformée, tous les éléments sauf 
un s’annulent et il devient facile de développer son déterminant suivant la 
première colonne. On obtient 


det A = (—1}#+la, det A’, 


où det 4° est le mineur associé à l'élément a,, dans la matrice transformée. 
Pour calculer det 4° on utilise le même procédé. Après 7 — 1 chemine- 
ments (parfois moins) on obtient le déterminant. 

Le procédé décrit a l’avantage par rapport aux autres car exige moins 
d’opérations arithmétiques. Pour trouver les déterminants de matrices pas 
trop grandes dont les éléments sont des nombres entiers ou des expressions 
algébriques simples, il est conseillé de l'utiliser en combinaison avec les 
autres procédés artificiels. | 

S. Mineurs d’ordre quelconque. Considérons une matrice À non néces- 
sairement carrée et choisissons s lignes quelconques de numéros i,, .., i et 
s colonnes quelconques de numéros j,, .., j.. Soit & < i, < .… < à,,j, < 
OS RE 

DÉFINITION. On appelle mineur d'ordre s de la matrice À le déterminant 
d’une matrice carrée d’ordre s formée des éléments situés à l’intersection 


des lignes et colonnes choisies, autrement dit le nombre 
fl Î î] 


a; a, CEA] js 

L'! i Ji Ja Îs 
ts 

j, . Js 00.000000... 

s ls [A 

Îl q;, CE a; 


Chaque matrice a autant de mineurs d’ordre donné s qu’il existe de pos- 
sibilités de choisir les numéros i,, ..…, à et j,, .…, j.. Il nous sera commode 
de dire que le mineur L; . : est situé à l’intersection des lignes de numéros 

as 
li, .…, f, et des colonnes de numéros j,, .…., j.. 


Si À est une matrice carrée, à chaque mineur L 7 5 d’ordre s on peut 


faire correspondre un mineur M; Ne qui est égal au déterminant 
js 
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d’une matrice carrée d’ordre 7 — s obtenue de À en supprimant les lignes 
de numéros i,, ..., i, et les colonnes de numéros j,, .…., j,, c’est-à-dire celles 


à l’intersection desquelles est situé le mineur L} L : : 
ns fe 


On appelle cofacteur d’un mineur son mineur associé multiplié par 


(= 1) + + is + jy + +is 


On a la proposition suivante connue sous le nom de théorème de 
Laplace. 


PROPOSITION. Etant donné une matrice carrée, choisissons ses s lignes 
quelconques de numéros i,, .…., i, et considérons tous les mineurs situés sur 
ses lignes. Le déterminant de la matrice considérée est alors égal à la somme 
des produits de chacun de ces mineurs par le cofacteur correspondant. 


Une assertion analogue peut être formulée pour les colonnes. 

On ne fournira pas de démonstration à cette proposition vu qu’on ne 
s’y référera pas dans la suite. Signalons seulement que le développement du 
déterminant suivant une ligne est un cas particulier de la proposition 9 pour 
S = Ï1. 

6. Expression du déterminant par les éléments de la matrice. On appelle 
permutation des nombres 1, ..., 7 ces nombres écrits dans un certain ordre. 
Par exemple, les nombres 1, 2 permettent de former deux permutations : 
(1, 2) et (2, 1). Une permutation quelconque des nombres 1, ..., n sera 
notée (i,, …, 4). 

On dira que i, est responsable du dérangement de l'ordre dans la per- 
mutation (i,, .…, à,) s'il se trouve à gauche d’un plus petit nombre. Par 
exemple pour 7 = 4, chacun des nombres 2 et 3 est responsable d’un seul 
dérangement de l’ordre dans la permutation (2, 4, 3, 1) et le nombre 4 de 
deux. Ainsi donc, le nombre total de dérangements de l’ordre dans cette 
permutation est quatre. Le nombre de dérangements de l’ordre dans la per- 
mutation (ë,, .…, i,) sera noté N(i,, …, à). 

La permutation (i,, ..…, à.) est dite paire si N(i,, …, i,) est un nombre 
pair, et ëmpaire dans le cas contraire. 

Proposons-nous de démontrer la formule suivante : 


a; .…e a,, Nü | 

= _- LE CRCEET IL 
00.000000 cu y ( 1) F Qii, di, CEE di, (6) 
a, a, Cr; ds In) 


La somme dans le second membre de l’égalité est prise suivant toutes les 
permutations des nombres 1, ..…., n. Cela veut dire qu’à chaque permuta- 
tion (i,, …, &,) des nombres 1, ..…., ñn on fait correspondre un terme de la 
somme d’après la règle suivante : on prend un élément de la première ligne 
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et de la i -ième colonne, puis un élément de la deuxième ligne et de la 
i,-ième colonne, etc. et on calcule leur produit qui contient donc un élément 
et un seul de chaque ligne et de chaque colonne. Leur produit est positif ou 
négatif suivant que la permutation correspondante est paire ou impaire. 
DÉMONSTRATION. Raisonnons par récurrence pour démontrer la formule 
(6). Soit ñ = 2 et soit une matrice carrée 
[es a] | 
dy An 
Aux deux permutations (1, 2) et (2, 1) correspondent deux termes 
(— 1) 0: Da, a, et (— 1)"C: Da,a,,. Leur somme est égale à a,,4,, — 
— 4,4), C'est-à-dire au déterminant même de la matrice donnée. 
Admettons que la formule est vraie pour les matrices carrées d’ordre 
n — l et démontrons qu’elle l’est encore pour toute matrice carrée À 
d'ordre ñn. Le déterminant de À est défini par la formule (1) dont le k-ième 
terme contient le facteur M1. Par hypothèse de récurrence 
M\ = det A! = y (SDS ne ee On 
Gin) 
où tous les numéros i,, .., i,_, sont différents de & ; quant aux premiers 
indices affectant les facteurs, ce sont 2, ..,n, car, en conservant les ancien- 
nes notations pour les éléments de la matrice À, on doit tenir compte du 
fait que la première ligne et la £-ième colonne ne figurent pas dans la 
matrice A}. 
On peut maintenant faire entrer le facteur (—1X*+ la, L Sous le symbole 
de sommation dans le £-ième terme de la formule (1) et l’écrire ainsi : 
(—1Y+ la, M} = y (On ROSE SRE T7 a 
astsg 
Les nombres K, i,, .…,i,_, Constituent une permutation des nombres 1, … 
…, 1, avec N(K, i,,...,i,_,) = NG,,...,5,-,) + & — 1,car à droite dekil 
y a exactement À — 1 nombres inférieurs à &. Donc, N(K, i,, …, i _,) est 
de la même parité que N(i,, .…, i,_,) + k + 1. Il vient 


CiNtaiM= D (CD"Erh-a, a, …. a 


lin)" 
(ë … in 1) 


Le second membre de cette expression réunit tous les termes de la somme 
(6) qui correspondent à des permutations ayant # à la première place. Etant 
donné que dans la somme (1) Æ parcourt toutes les valeurs de 1 à n, cette 
somme contient tous les termes de la somme (6) et eux seuls. La formule (6) 
est démontrée. 
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$ 3. Systèmes d’équations linéaires (cas spécial) 


1. Position du problème. On appelle système de m équations linéaires à 
n inconnues Xx\, .…, x" *) le système d'équations de la forme 


aix! + alx +... + alx7 = bi, 
ax! + ax +... +ax = b?, (1) 


a. a … a! 
A lions salineise 
œ _æ a 


appelée matrice du système. Les nombres figurant dans les seconds mem- 
bres des équations constituent la matrice-colonne b appelée matrice- 
colonne des termes constants. 

La matrice du système complétée par la matrice-colonne des termes 
constants est appelée matrice complète du système et est notée 4* dans ce 
chapitre : 


am am … am br 


n 


Si les termes constants de toutes les équations sont nuls, le système est 
dit homogène. 


DÉFINITION. Un ensemble de r nombres æ!, ..., æ" est appelé solution du 
système (1) si toutes les équations du système deviennent des égalités numé- 
riques après substitution des nombres a, i = 1, ..…., ñn, aux inconnues res- 
pectives x'. 

Proposons-nous de rechercher les solutions du système (1) sans faire de 
suppositions ni sur la nature des coefficients et des termes constants du 
système ni sur le nombre d'équations et d’inconnues. Aussi les situations 
qui peuvent se présenter, sont-elles les plus diverses. Le système peut même 
ne pas avoir de solution, comme par exemple le système 


x +x= 1, 
x! +x?=0 


+) On écrit en haut les indices affectant les inconnues, pour pouvoir présenter dans la 
suite l’ensemble des inconnues sous forme de matrice-colonne. 
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(si la solution existait, x! + x? serait à la fois égal à O et à 1). Le système 
peut avoir une infinité de solutions, comme par exemple le système 
(n = 2,m = 1) 


xl + x = 0. 


Les solutions de ce système sont tous les couples de nombres opposés. 
Quant aux exemples de systèmes présentant une solution unique, on les a 
rencontrés à maintes reprises dans le cours d’algèbre enseigné à l’école 
secondaire. 

On dit que le système est compatible s’il a des solutions, et incompati- 
bles s’il n’en a aucune. 

2. Règle de Cramer. On examinera maintenant le cas le plus simple 
quand le nombre d'équations est égal à celui d’inconnues, soit 7 = m. On 
imposera de plus certaines conditions aux coefficients du système, car 
autrement on serait obligé d'examiner, par exemple, le système composé 
d’une même équation répétée 7 fois. Notre intention est d'étudier les systè- 
mes dont toutes les équations sont, dans un certain sens, indépendantes. 
Déjà à l’école secondaire, on a largement utilisé le procédé suivant : on 
multipliait la première équation par un nombre «, la deuxième par B et on 
additionnait ces équations membre à membre. L’équation obtenue (natu- 
rellement appelée combinaison linéaire des équations initiales) est leur con- 
séquence. Nous voulons donc qu'aucune équation du système ne soit une 
combinaison linéaire des autres. Si cette condition est satisfaite, on dira 
que les équations sont linéairement indépendantes. 

Dans le cas où m = nñn, pour que les équations soient linéairement indé- 
pendantes il suffit d'exiger que le déterminant de la matrice du système soit 
différent de zéro. (Puisque m = ñn et la matrice est carrée, on a toutes les 
raisons de parler de son déterminant.) En effet, remarquons qu’en multi- 
pliant une équation quelconque par un nombre, on multiplie la ligne cor- 
respondante de la matrice par ce nombre. En additionnant les équations, 
on additionne les lignes de la matrice. 11 s’ensuit que si l’une des équations 
est une combinaison linéaire des autres, la ligne correspondante de la 
matrice du système est une combinaison linéaire des autres lignes. Il ressort 
alors de la proposition 7 du $ 2 que dans ce cas le déterminant de la matrice 
est nul. 


THÉORÈME 1 (RÈGLE DE CRAMER). Le système de n équations à n inconnues 
aix! + … + alx7 = bi, 


Mises dntertes (2) 


possède une solution et une seule si le déterminant de la matrice du système 
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est non nul. Cette solution est définie par la formule 
i 
xi = . (pourtousles i = 1,...,n), (3) 


où À est le déterminant de la matrice du système et A le déterminant de la 
matrice déduite de la matrice du système par substitution de la colonne des 
termes constants à la i-ième colonne, c'est-à-dire 


b! a! 


Pour démontrer le théorème considérons la matrice complète du 
système A4* et écrivons au-dessus d’elle l’une quelconque de ses lignes. Soit 
j le numéro de cette ligne. On obtient ainsi la matrice carrée À d’ordre 
n + 1. Cette matrice comporte deux lignes identiques et, par suite, 


œ a, bd 
a! al  b! 

DEA sise = 0 
at … a b 


On peut aussi calculer det À en partant de la définition, soit : 


ÿ (—1)+'@M, + (—-1ÿ*!+lb/det A = 0, 
11 
où M est le déterminant de la matrice déduite de la matrice complète 4* 


par suppression de la i-ième colonne. Donc, compte tenu de ce que À = 
= det À + 0, on peut écrire 


CUS ; 
DE Gus D ai(—1}+1M, = b. 
i =) 
Si l’on fait entrer le facteur sous le symbole de sommation, cette égalité 
prend la forme 


y ax = b/, 
où : 


L'ensemble des nombres x!, .…, x” ainsi défini vérifie, comme on le voit, la 
j-ième équation du système. Il est important que les nombres x!, ., x" sont 
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indépendants de j et, de ce fait, vérifient toutes les équations du système, 
autrement dit, sont sa solution. On a ainsi démontré l'existence de la solu- 
tion. : 
On donnera à x’ la forme voulue en mettant dans À la dernière colonne 
b à la i-ième place, c’est-à-dire en la permutant successivement avec les 
colonnes de numéros 7, ñn — 1, ..,i + 1. Il faut faire en tout nr — i per- 
mutations. On a alors 
; ee D A D 2 i Ai A' 
x = re = — 
A A 
C’est justement la forme exigée pour x'. 
Il nous reste à démontrer l’unicité de la solution obtenue. Raïisonnons 
par l’absurde. Soient deux solutions du système 


ot et Bl,...,Bn. (4) 


En utilisant les opérations avec les matrices-colonnes, on peut écrire (1) : 
sous la forme (voir p. 125) 


al a} b! 
xl. +... +xt 1. = [1 (S) 
a! al ll 


ou de façon plus condensée x'a, + ... + x’a, = b, où a;,, …, a, sont les 

colonnes de la matrice du système, b la matrice-colonne des termes cons- 

tants. Cette écriture du système est fort commode et on l’utilisera souvent. 
La substitution des solutions (4) dans le système donne 


ala, + … + aa, = b, 
Bla, + … + B'a, = b. 
En retranchant membre à membre la seconde équation de la première, on 
obtient 
(@! — GBl)a, + … + («* — B')a, = 0 


Si les solutions ne se confondent pas, au moins une des différences : — fi | 
est non nulle. Or cela signifie que les matrices-colonnes a,, .…., a, sont 
linéairement dépendantes, ce qui contredit, en vertu de la proposition 7 du 
$ 2, que det A # 0. Le théorème est démontré. 

Il vaut la peine de signaler que la coïncidence du nombre des équations 
avec celui des inconnues ne joue que vers la fin de la démonstration, ce qui 
nous permet de démontrer une assertion plus générale : si les colonnes de la 
matrice du système sont linéairement indépendantes, le système ne peut 
avoir deux solutions différentes. 

3. Exemple. En appliquant la règle de Cramer, recherchons la condition 
à laquelle trois plans se coupent en un point. Soient trois plans définis dans 
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un repère cartésien par les équations 
A,x + B,y + C,z + D, = 0, 
A,x + B,y + C;z + D, = 0, (6) 
A,x + B,y + C;z + D, = 0. 


Les coordonnées du point d’intersection doivent vérifier simultanément les 
trois équations, c’est-à-dire être la solution du système (6). On voit qu’à la 


condition 
A, B C, 
À, B, C,| #0 
A, B, C, 


il existe un point d’intersection et un seul. Rappelons que cette condition a 
été obtenue au $ 3 du ch. II. La règle de Cramer n’entraïne que la suffi- 
sance de la condition, vu qu’elle représente, elle aussi, une condition suffi- 
sante d’existence et d’unicité de la solution. 

Une autre interprétation géométrique de la règle de Cramer a été four- 
nie pour le système de trois équations au point 6, $ 3, ch. I. Il en résultait 
non seulement la condition d’unicité de la solution mais aussi les formules 
permettant de trouver cette solution. 

L'étude des systèmes linéaires quelconques passe par celle des proprié- 
tés des matrices rectangulaires qui font l’objet du paragraphe suivant. 


$ 4. Rang d’une matrice 


1. Mineur principal. On a défini le mineur d’ordre r de la matrice À à la 
p. 137. Introduisons maintenant la définition suivante. 


DÉFINITION. Etant donné une matrice à m lignes et #7 colonnes, on dit 
que son mineur d'ordre r est principal s’il est différent de zéro et si tous les 
mineurs d'ordre r + 1 sont nuls ou n'existent pas (dans le dernier cas, r 
coïncide avec le plus petit des nombres m ou n). 

Il est évident qu’une matrice peut avoir plusieurs mineurs principaux. 
Tous les mineurs principaux sont du même ordre. En effet, si tous les 
mineurs d’ordre 7 + 1 sont nuls, sont également nuls tous les mineurs 
d’ordre r + 2 et, par suite, de tous les ordres supérieurs. L’assertion 
devient évidente si l’on applique la définition du déterminant à l’un quel- 
conque des mineurs d’ordre r + 2 ; en effet, tous les mineurs associés aux 
éléments de sa première ligne sont des mineurs d'ordre r + 1 de la matrice 
considérée et, par suite, sont nuls. 

On appelle colonnes et lignes principales les colonnes et les lignes à 
l'intersection desquelles est situé le mineur principal. 
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DÉFINITION. On appelle rang d’une matrice l’ordre du mineur principal, 
ou le plus grand ordre pour lequel il existe des mineurs non nuls. Si chaque 
élément de la matrice est nul, le rang de cette matrice est par définition égal 
à 0. 

Le rang de la matrice À est noté Rg 4, ou rang A. 

Trier un à un tous les mineurs pour rechercher le mineur principal est 
une opération exigeant d’énormes calculs si les dimensions de la matrice 
sont assez grandes. Il est beaucoup plus simple de calculer le rang de la. 
matrice et son mineur principal en recourant aux transformations élémen- 
taires. 


PROPOSITION 1. Les transformations élémentaires ne modifient pas le 
rang d'une matrice. 


DÉMONSTRATION. 1) Si on multiplie une ligne par le nombre À # 0, le 
mineur principal devient multiplié par À ou bien demeure inchangé. Aucun 
mineur nul ne devient différent de zéro. 

2) Si tous les mineurs d’ordre r + 1 sont nuls, l’addition des lignes ne 
rend aucun d’eux différent de zéro. En effet, le mineur obtenu dans cette 
transformation est égal soit à la somme algébrique de deux mineurs d’ordre 
r + 1 de la matrice initiale (si à une ligne du mineur on ajoute une autre 
ligne qui n’y figure pas), soit à la somme d’un mineur d’ordre 7 + 1 et 
d’un déterminant de la matrice ayant deux lignes identiques (si à une ligne 
du mineur on ajoute une ligne qui y figure). Ces considérations entraînent 
que le rang de la matrice ne peut augmenter. Il va de soi qu’il ne peut non 
plus diminuer, car autrement la soustraction des lignes, qui est une trans- 
formation inverse, l’aurait fait augmenter. 

3) Si on permute les lignes de la matrice, le mineur peut modifier son 
signe (si les deux lignes permutées lui appartiennent) ou devenir égal, au 
signe près, à un autre mineur de la même matrice (s’il contient une seule 
ligne des lignes permutées), ou bien ne pas se modifier du tout. Il est évi- 
dent que dans ce cas l’ordre du mineur principal reste inchangé. 

4) On démontre de façon analogue que les transformations élémentaires 
des colonnes ne changent pas le rang de la matrice. 

Il sera préférable pour nous de considérer les transformations élémen- 
taires des lignes de la matrice, vu leur étroite liaison avec les transforma- 
tions des systèmes d’équations linéaires. Pour le système de 7 équations à 
n inconnues 


sure Re (1) 


10— 6442 
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la matrice complète prend la forme 


a; a,  b, 
AT ms Su autre 
de QD: 


La permutation des lignes de cette matrice équivaut au changement de 
l’ordre des équations du système. La multiplication d’une ligne par le nom- 
bre À # 0 équivaut à la multiplication de l’équation correspondante par ce 
nombre. Enfin, ajouter une ligne de la matrice 4° à une autre revient à 
additionner les équations correspondantes du système. Dans toutes les 
transformations l’ensemble des solutions du système ne varie évidemment 
pas. On a démontré ainsi la 


PROPOSITION 2. À chaque transformation élémentaire des lignes de la 
matrice complète correspond une transformation du système d'équations 
linéaires en un système équivalent. 


Montrons maintenant comment obtenir le mineur principal d’une 
matrice à l’aide des transformations élémentaires. 

2. Obtention de la forme simplifiée d’une matrice. Soit une matrice À 
de type (m, n). Si tous ses éléments sont nuls, le rang de la matrice est 0 et le 
mineur principal n'existe pas. Si ce n’est pas le cas, soit j, le numéro de la 
première colonne contenant des éléments non nuls et soit a, j, UN élément 


non nul de cette colonne. Portons la i,-ième ligne à la première place et 


divisons-la par a. Notons a; les éléments de la matrice transformée. Il 


vient alors ai; = ]. Effectuons les transformations élémentaires des lignes 
pour que tous les autres éléments de la j,-ième colonne s’annulent. Il faut 
pour cela soustraire la première ligne multipliée par FR de chaque ligne de 
numéro (nouveau) & # 1. 

Après ces transformations la matrice prend la forme 


O0 … O lI 
0 0 oO 

el PT U , 
0 0 0 


où U, est une matrice à m lignes et n — j, colonnes. 

Si les m — 1 dernières lignes de la matrice À, sont nulles, on achève les 
transformations. Sinon, soit j, le numéro de la première colonne à élément 
non nul dans l’une des m — 1 dernières lignes. Transportons la ligne avec 
cet élément non nul à la deuxième place et divisons-la par cet élément. 
Notons a;: les éléments de la matrice transformée. Alors a;. = 1. 

Effectuons les transformations élémentaires nécessaires pour que tous 
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les autres éléments de la /,-ième colonne deviennent nuls. Pour le faire, il 
faut soustraire la deuxième ligne multipliée par dy, de chaque ligne de 
numéro À # 2. Ceci étant, les j, premières colonnes de la matrice À, ne 
varient pas, car les éléments situés à l’intersection de ces colonnes avec la 
deuxième ligne sont des zéros. La matrice prend maintenant la forme 


O0 .… O0 ll | de + | 0 

0 …… O0 0 O0 .… oO ll 
a te U, ||, 

0 0 O0 oO 0 oO 


où U, est une matrice à m1 lignes et n — j, — j, colonnes ; les étoiles dési- 
gnent des éléments dont on ne peut rien dire. 

Si dans les m — 2 dernières lignes il y a des éléments non nuls, on effec- 
tue des transformations analogues qui permettent de passer de la j,-ième 
colonne à une colonne dont tous les éléments sont des zéros à l’exception 
du troisième élément égal à l’unité. A gauche de cette colonne, dans les 
m — 2 dernières lignes on ne trouve que des éléments nuls, de sorte que les 
colonnes déjà transformées ne changent pas. 

On poursuit ces transformations jusqu’à ce que les »m — r dernières 
lignes de la matrice À, ne présentent que des zéros ou que toutes les lignes 
soient épuisées. 

On a ainsi la 


PROPOSITION 3. Toute matrice de type (m, n) peut être transformée en 
une matrice dont r colonnes cotncident avec les r premières colonnes de la 
matrice unité d'ordre m. Les m — r dernières lignes sont constituées de 
zéros si r < m. 


On appellera forme simplifiée \a forme de la matrice décrite dans cette 
proposition. Les matrices de cette forme seront dites tout simplement sim- 
plifiées. 

Considérons une matrice de forme simplifiée. Son mineur situé à 
l'intersection des r premières lignes et des colonnes j,, ..…, j, est égal à 
l’unité. Il n’y a évidemment pas de mineurs non nuls d'ordre supérieur. 
Donc, c’est un mineur principal, et le rang de la matrice est r. 

Si l’on peut passer de la matrice À à une matrice simplifiée de rang 7, 
cela signifie que la matrice À est également de rang r. En effet, les transfor- 
mations élémentaires ne modifient pas le rang de la matrice. Pour mineur 
principal de la matrice À on peut prendre le mineur situé à l’intersection 
des colonnes de numéros j,, .…, j, et des lignes qui, toutes les permutations 
étant effectuées, prennent les numéros 1, .., r dans la matrice simplifiée. 
Cela découle du fait qu’en transformant la matrice À on n’a ajouté aux 
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lignes de ce mineur aucune ligne qui n’y figure pas. Puisque le mineur 
obtenu n’est pas nul, il en est de même du mineur initial. 

Remarquons que la matrice dont il s’agit dans la proposition 3 résulte 
des transformations élémentaires effectuées sur les lignes. Cette remarque 
est importante à cause de la proposition 2. La méthode utilisée dans la 
démonstration est appelée méthode de Gauss (ou de Gauss-Jordan). 

Considérons une matrice carrée dont le déterminant est différent de 
zéro. Toutes ses colonnes sont principales et, par suite, sa forme simplifiée 
représente une matrice unité. D’où le 


CoOROLLAIRE. Toute matrice carrée de déterminant non nul peut être 
réduite par transformations élémentaires à une matrice unité. 


La recherche du mineur principal dans la démonstration de la proposi- 
tion 3 aboutit à un ensemble des premières colonnes renfermant le mineur 
principal. Pour une matrice de forme simplifiée ce fait est sans importance. 


PROPOSITION 4. Soit À une matrice de type (m, n). Quel que soit le 
mineur principal de cette matrice, il existe des transformations élémentaires 
des lignes de À qui permettent de passer des colonnes du mineur à celles de 
la matrice unité. Si Rg A = r < m, les m — r dernières lignes sont nulles. 


DÉMONSTRATION. Supposons que le mineur principal est situé à l’inter- 
section des lignes ,, …, et des colonnes j,, …, j. Portons ces colonnes à 
la place des 7 premières et procédons comme dans la démonstration de la 
proposition 3, à la seule différence qu’on doit choisir un élément non nul 
de la colonne suivante parmi les éléments des lignes de numéros à, ..…, à. 
Cet élément existe toujours, sinon le mineur principal s’annulerait par 
transformations élémentaires de ses lignes. Les transformations étant 
effectuées, il faut ramener les colonnes à leurs places. On peut d’ailleurs ne 
pas toucher aux colonnes et modifier quelque peu la méthode de réduction. 

3. Théorème du mineur principal. L’exposé qui suit s’appuie dans une 
large mesure sur une assertion connue sous le nom de théorème du mineur 
principal. 

THÉORÈME 1. Chaque colonne (resp. ligne) de la matrice est une combi- 
naison linéaire des colonnes (resp. lignes) principales. 


Pour démontrer l’assertion du théorème relative aux lignes, revenons 
aux transformations élémentaires utilisées dans la démonstration de la pro- 
position 4 pour réduire la matrice à sa forme simplifiée. Outre les permuta- 
tions des lignes et la multiplication des lignes principales par des nombres, 
on ajoutait à une ligne quelconque de la matrice l’une de ses lignes princi- 
pales multipliée par un nombre. Les lignes principales se remplaçaient dans 
ce cas par des combinaisons linéaires des lignes principales, et aux lignes 
non principales venaient s’ajouter les combinaisons des lignes principales. 


$ 4] RANG D'UNE MATRICE 149 


Dans une matrice simplifiée, les lignes non principales sont nulles. Cela 
signifie que pour chaque ligne non principale de la matrice initiale on a 
trouvé une combinaison linéaire de ses lignes principales telle que leur 
somme est la ligne nulle. L’assertion est démontrée. 

L’assertion du théorème relative aux colonnes sera aussi démontrée si 
l’on applique l’assertion déjà démontrée pour les lignes à la matrice trans- 
posée en notant préalablement que le mineur principal de la matrice est 
encore un mineur principal de sa transposée. 

On a affirmé dans la proposition 7 du $ 2 que le déterminant de la 
matrice dont les colonnes sont linéairement dépendantes est nul. Le théo- 
rème du mineur principal entraîne une assertion réciproque. 


PROPOSITION 5. Si À est une matrice carrée et det A = 0, il existe au 
moins une colonne (resp. ligne) qui est une combinaison linéaire des autres 
colonnes (resp. lignes). 


En effet, la condition det À = 0 signifie que RgA < n — loùnest 
l’ordre de la matrice. Donc, il existe au moins une colonne (resp. ligne) qui 
ne coupe pas le mineur principal. Or cette colonne (resp. ligne) s'exprime 
linéairement par les colonnes (resp. lignes) sur lesquelles est situé le mineur 
principal. 


THÉORÈME 2. (THÉORÈME DU RANG D'UNE MATRICE). Le rang d'une matrice 
A est égal au nombre maximal de ses colonnes linéairement indépendantes. 


Si RgA = 0, toutes les colonnes sont nulles et aucune colonne n’est 
linéairement indépendante. Soit RgA = r > 0. Montrons que dans À il 
existe r colonnes linéairement indépendantes. En effet, considérons une 
matrice carrée À” d'ordre r extraite de la matrice À, dont le déterminant est 
le mineur principal. Chaque colonne de A’ représente une partie de la 
colonne correspondante de À. 

Si les colonnes de À renfermant le mineur principal étaient linéairement 
dépendantes, il en serait de même des colonnes de A’ et le mineur principal 
serait nul. 

Démontrons maintenant que toute famille de p colonnes de la matrice 
A est liée sip > r. Soit B une matrice composée de p colonnes quelconques 
dc A.OnaRgB < r. En effet, chaque mineur de la matrice B est le mineur 
de la matrice À et par suite, il n’y a dans B aucun mineur non nul dont 
l’ordre est strictement supérieur à r. Ainsi, Rg B < p et au moins une des 
colonnes de la matrice B n'appartient pas à son mineur principal. 

Cette colonne s'exprime linéairement au moyen des autres colonnes. Le 
théorème est ainsi démontré. 

On démontre de la même façon que le rang de la matrice est égal au 
nombre maximal de lignes linéairement indépendantes. 
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CoroLLAIRE. Le nombre maximal de lignes linéairement indépendantes 
dans une matrice est égal au nombre maximal de colonnes linéairement 
indépendantes de cette matrice. 


$ S. Théorie générale des systèmes linéaires 


1. Condition de compatibilité. Le théorème du mineur principal permet 
de formuler une condition simple et efficace de compatibilité du système 
d’équations linéaires 


RE (1) 


qui porte le nom de théorème de Kronecker-Capelli. 


THÉORÈME 1. Le système (1) possède au moins une solution si et seule- 
ment si le rang de la matrice du système À est égal au rang de la matrice 
complète A*. 


Pour le démontrer, mettons le système (1) sous une autre forme en utili- 
sant les définitions des opérations sur les matrices-colonnes. Il vient 


al al b! 
xt. + +. = 11... 11. (2) 
am am b" 


n 


1) Si la solution existe, l’égalité (2) signifie que la matrice-colonne des 
termes constants est une combinaison linéaire des colonnes de la matrice du 
système. Donc, l’adjonction de cette matrice-colonne n’augmente pas le 
nombre total de colonnes linéairement indépendantes, et Rg 4* = Rg A. 

2) Soit Rg A* = Rg A. Dans ce cas, le mineur principal de la matrice À 
l’est encore de la matrice A*. Cela signifie que la matrice-colonne des ter- 
mes constants est une combinaison linéaire des colonnes de la matrice À 
qui renferment le mineur principal. Selon la proposition 6 du $ 1, la 
matrice-colonne des termes constants est dans ce cas une combinaison 
linéaire de toutes les colonnes de la matrice À. Les coefficients de cette 
combinaison linéaire représentent la solution du système (1). 


COROLLAIRE.. Le Système (1) est incompatible si et seulement si la 
matrice simplifiée associée à la matrice complète A* contient la ligne 
10 .. O 11. (On suppose que les colonnes n’ont pas été permutées.) 


DÉMONSTRATION. Si RgA* > Rg A, tout mineur principal de la matrice 
A* doit contenir la dernière colonne. Or si la dernière colonne est princi- 
pale, la matrice simplifiée associée à la matrice 4* doit comporter la ligne 
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10 ...0 11. Inversement, si la matrice simplifiée associée à la matrice 4* 
contient une telle ligne, sa dernière colonne ne peut être une combinaison 
linéaire des autres colonnes, et le système correspondant à la matrice sim- 
plifiée est donc incompatible. Or ce système est équivalent au système ini- 
tial. 

A titre d’exemple, déduisons du théorème de Kronecker-Capelli la con- 
dition de parallélisme de deux droites non confondues d’un même plan. 


Les droites 
A,x+ B,y+C,=0, 
A,Xx + B,y + C, = 0 


sont parallèles si elles n’ont aucun point commun, c’est-à-dire si 


Re | B, < Re[® BC, | 
À, B, À, B, C,; 


On peut exprimer l'égalité des rangs de la matrice du système et de la 
matrice complète en interprétant le rang comme le nombre maximal de 
lignes linéairement indépendantes. On aboutit ainsi à la proposition 1 for- 
mulée plus loin et connue sous le nom de théorème de Fredholm. Quoique 
s’adaptant difficilement à l’étude des systèmes d'équations, ce théorème est 
d’une grande importance théorique. 

Transposons la matrice À du système (1) et considérons le système de n 
équations linéaires 


(3) 


RS (4) 


à m inconnues, dont la matrice est ‘ A et dont les seconds membres sont 
nuls. On dit que ce système est homogène adjoint du système (1). 


PROPOSITION 1 (THÉORÈME DE FREDHOLM). Pour que le système d'équations 
linéaires (1) soit compatible il faut et il suffit que toute solution du système 
homogène adjoint (4) vérifie l'équation 


by, + … + by, = 0, (5) 
où b!, .…, b"' sont les termes constants des équations (1). 


Démontrons que la condition est suffisante. Si la relation (5) est vérifiée 
par toutes les solutions du système (4), le système d’équations 


aly, TS IT ay, _ 0, 
Miss de unes sions ense (6) 
: . 


T 
= 

+ 

< 
ù 
3 

(| 
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ne peut avoir de solutions. Il en ressort que le rang de la matrice de ce 
système est strictement inférieur au rang de la matrice complète. Transpo- 
sons ces deux matrices et tenons compte de ce que cette opération ne 
change pas leur rang. On obtient 


a 4: “a, D! a) … a  b! 
Dose En 
Fe … a tv œm__ _æ tv 

O0 …… oO | 


Le théorème du rang d’une matrice implique maintenant que la matrice- 
ligne 10 ...0 11 n’est pas une combinaison linéaire des lignes de la matrice 


l I I 
a, .… ga, b 


et, par suite, cette ligne ne peut pas figurer dans la matrice simplifiée asso- 
ciée à cette matrice. Il s’ensuit, compte tenu du corollaire au théorème de 
Kronecker-Capelli, que le système (1) est compatible. 

Démontrons maintenant que la condition est nécessaire. Raisonnons 
par l’absurde en supposant que cette condition n’est pas satisfaite. Il existe 
alors une solution y,, ..…., y,, du système (4) pour laquelle b,y, + 

. + 0,7, = P # 0. Multiplions les équations du système (1) par les 
nombres respectifs y,, .…, y,, et additionnons-les. On obtient l’équation 


Ox! + ... + Ox7 = p, 


qui n’a aucune solution. Si le système (1) avait des solutions, elles devraient 
vérifier cette équation. Donc, le système (1) est incompatible : contradic- 
tion. 

A titre d'exemple, appliquons le théorème de Fredhoïlm pour déduire la 
condition de parallélisme de deux droites non confondues d’un même plan. 
Le système (3) n’a pas de solutions s’il existe des nombres y, et y, pour les- 
quels y, A, + y,4, = 0, y,B, + y,B, = 0 mais y,C, + y,C, # 0. On 
constate facilement que y, et y, ne sont pas nuls. On peut donc poser 
—},/y, = Xet écrire la condition obtenue sous la forme : il existe un nom- 
bre À tel que À, = XA4,, B, = XB, et C, # ÀC.. 

2. Recherche des solutions. Soit donné un système compatible de 
équations linéaires à 7 inconnues. Notons r le rang de la matrice du 
système. Vu que le rang de la matrice complète est aussi égal à r, on peut 
choisir le mineur principal de la matrice complète de manière qu'il soit con- 
tenu dans la matrice du système. Par des transformations élémentaires des 
lignes, réduisons la matrice complète à la matrice simplifiée (proposition 3 
du $ 4). Selon la proposition 2 du $ 4, le système donné d’équations linéai- 
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res se transforme alors en un système équivalent de 7 équations lineaire- 
ment indépendantes. 

Admettons pour plus de commodité que le mineur principal est situé sur 
les r premières colonnes. Le système transformé peut alors être écrit sous la 
forme suivante : 


xl = bl— (al, ,xtl +. + alxt), 
STATE TEE messes se. (7) 
x = br — (a, ,xtl +. + ax), 


où ai et bi sont les éléments de la matrice complète transformée. Dans les 
premiers membres des égalités, on a écrit les inconnues correspondant aux 
colonnes du mineur principal choisi, appelées inconnues principales. Les 
autres inconnues, dites paramétriques ou non principales, sont portées 
dans les seconds membres des égalités. 

Quelles que soient les inconnues paramétriques, les formules (7) per- 
mettent de trouver les inconnues principales qui constituent toutes ensem- 
ble la solution du système (1). On voit aisément que ce procédé nous permet 
d’obtenir toutes les solutions du système. 

On aurait pu s'arrêter aux formules (7), toutefois on donnera plus loin 
une description de l’ensemble des solutions du système d’équations linéai- 
res qui est beaucoup plus simple et parlante, ainsi que présentant une 
importance de principe. 

3. Système homogène associé. Associons au système d'équations (1) un 
système homogène ayant la même matrice des coefficients, autrement dit le 
système 


TS (8) 
ax! +. + ax = 0. 
On l’appelle système homogène associé a (1). 


PROPOSITION. Si y}, …, yf est une solution du système (1), y!, …, y" est 
aussi une solution du système (1) si et seulement s’il existe une solution 
x!, …, x" du système homogène associé à (1) telle que y‘ = yi + x' pour 
tout i = 1, ...,n. 

DÉMONSTRATION. 1) Soient a,, .…, a, les colonnes de la matrice du 
système (1), et b la matrice-colonne de ses seconds membres. Soient de plus 
y}, …, y3 la solution : 


pla + … + y6a, = b, (9) 
et x!, .…, x" la solution du système homogène associé à (1) : 
x'a, +. +x'a, = 0. (10) 
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En additionnant membre à membre les égalités (9) et (10), on obtient 
CO! + xlja, + … + (5 + x')a, = b, 


c’est-à-dire que les nombres yl + x!,…, y + x" vérifient le système (1). 
2) Soit y!, …, y” une solution du système (1) : 


y'a, +... + y'a, = b. (11) 
En retranchant (9) de (11)},on a 
G! — ylja, + … + (7 — yfja, = 0. 


Cela signifie que les nombres x! = y! — pl, ...,x" = y7 — y vérifient le 
système homogène associé. La proposition est démontrée. 

En écrivant la solution sous forme de matrice-colonne à n éléments on 
peut formuler la proposition 2 ainsi : si y, est une solution du système (1), il 
en est de même de y si et seulement s’il existe une solution x du système 
homogène associé telle que y = y, + x. 

Dans la suite, pour abréger on utilisera cette écriture. 

4. Ensemble des solutions d’un système homogène. Tout système 
homogène d’équations linéaires est compatible. Il a pour solution 0, .…, 0 
que l’on appelle solution triviale. Tous les résultats précédents obtenus 
pour les systèmes d'équations linéaires sont évidemment vrais pour les 
systèmes homogënes. En particulier, sont vraies les formules (7) qui pour le 
système homogène prennent la forme 


xl = — (al, xt! + … + aix), 


En effet, dans les formules (7) on a b! = 0, ., b" = 0, vu que les opéra- 
tions élémentaires sur les lignes transforment la matrice-colonne nulle des 
termes constants en une matrice-colonne nulle. 

L'ensemble des solutions d’un système homogène possède deux pro- 
priétés importantes qu’exprime la proposition suivante. 


PROPOSITION 3. Si les matrices-colonnes x, et x, sont des solutions du 
système homogène, leur somme x, + x, est aussi une solution de ce 
système. Le produit de la solution d'un système homogène par un nombre 
est encore une solution de ce système. 


DÉMONSTRATION. Etant donné que 
1 _ = 
Xj4, +. + x14, = O et Xj4, + … + x54, = 0, 
il vient 
(x + xla, + … + (x? + xi)a, = 0 
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et 
Axla, + … + Axa, = 0, 


quel que soit À. La proposition est démontrée. 

Dans la démonstration des deux propositions suivantes, on utilise les 
formules (7°). Aussi la numération des variables adoptée y reflète-t-elle 
l'hypothèse faite pour (7) et (7°) que le mineur principal de la matrice du 
système est situé sur les r premières colonnes. 


PROPOSITION 4. Si le rang de la matrice d’un système homogène est r, le 
système possède n — r solutions linéairement indépendantes. 


Pour le démontrer, associons aux inconnues paramétriques #7 — r 
ensembles de valeurs : 


1) xtl=1, rti=0, nn: te x = 0; 
2) xtl=0, xt2=1, x+3=0, rs XT:-=;:0: 
nr) xtl =0, ss ns xl = 0, xt — |: 


Pour chaque ensemble de valeurs des inconnues paramétriques cher- 
chons les valcurs correspondantes des inconnues principales. Ecrivons les 
solutions obtenues sous forme de matrices-colonnes : 


x! x; x 


x x, M, 

X, = | », X = 0 PR 0 : (12) 
0 | 
0 0 | 


Ces solutions sont linéairement indépendantes. En effet, soit la matrice 
dont les colonnes sont x,, .…, x,_,. Elle possède un mineur d'ordre n — r 
(situé sur les 7 — r dernières lignes) égal à l’unité. Par conséquent, son 
rang est 7 — r et toutes ses colonnes sont linéairement indépendantes. 
L'ensemble des solutions (12) est appelé système fondamental normal 
de solutions. D'une façon générale on appelle système fondamental de 
solutions tout ensemble de 7 — r solutions linéairement indépendantes. 


PROPOSITIONS. Soit x,, .…, x, _, un ensemble fondamental de solutions 
d'un système d'équations linéaires homogènes. Toute solution x du 
système est alors une combinaison linéaire des solutions x,, …, x 


RARE 
Pour le démontrer, considérons la matrice X dont les colonnes sont les 
solutions xet x,,...,x,_,. Le rang de X'#st au moins égal à n — r, car cette 


156 SYSTÈMES D'ÉQUATIONS LINÉAIRES ET MATRICES [CH.V 


matrice comprend 7 — r colonnes linéairement indépendantes. D'autre 
part, il est au plus égal à 7 — r. En effet, la première des formules (7°) 
exprime la première inconnue principale x! sous forme de polynôme 
linéaire en inconnues paramétriques, les coefficients de ce polynôme étant 
les mêmes pour toutes les colonnes de la matrice X. Aussi la première ligne 
de la matrice est-elle une combinaison linéaire des 7 — r dernières lignes. 
Autrement dit, si l’on multiplie les 7 — r dernières lignes de la matrice X 
par les coefficients de la première des formules (7°) et qu’on additionne, on 
obtient la première ligne de cette matrice. De façon analogue à l’aide des 
autres formules (7°), on peut montrer que les lignes de numéros 2, …,r 
sont des combinaisons linéaires des dernières lignes. Donc, par des trans- 
formations élémentaires, on peut rendre nulles les 7 premières lignes de la 
matrice X, ce qui signifie que son rang ne dépasse pas 7 — r. 

On voit que le rang de la matrice considérée est 7 — r. Elle possède 
donc un mineur principal situé sur les colonnes x,, .., x, _,, de sorte que la 
proposition 5 découle du théorème du mineur principal. 

Soit x,, …, x,_, un ensemble fondamental de solutions d’un système 
d’équations linéaires homogènes. Considérons la matrice-colonne x = 
= C,x, +. + C,_,x,-, et présentons-la sous la forme suivante : 


x x! x, 
sl=Calis ce te 1e (13) 
x" x Xn=r 


11 découle de la proposition 1 que la combinaison linéaire d’un ensemble 
quelconque de solutions du système homogène est aussi sa solution. Par 
conséquent, quels que soient les nombres C,, …, C,_,, la matrice-colonne 
x définie par la formule (13) est une solution du système d’équations homo- 
gènes étudié. Inversement, selon la proposition 5, pour toute solution du 
système homogène il existe des nombres C,, ..…., C,_, pour lesquels cette 


solution prend la forme (13). 


Une question se pose tout naturellement : est-ce qu'il existe un ensemble des < nn -7r 
solutions telles que chacune des solutions du système d'équations linéaires homogènes cest une 
combinaison linéaire des solutions de l’ensemble considéré ? On démontre aisément que la 
réponse est négative. En effet, supposons qu'un tel ensemble de solutions existe. Considérons 
unc matrice G de type (7, n — r + s) dont les colonnes sont les solutions appartenant à cet 
ensemble et au système fondamental normal de solutions. D'une part, on a RgG = set, 
d'autre part, RgG = n — r. On aboutit donc à une contradiction. 


S. Solution générale d’un système d’équations linéaires. On peut main- 
tenant généraliser les résultats acquis dans les propositions 2 et 5. 


THÉORÈME 2. Si y, est une solution particulière du système (1) et x,, … 
x___ un ensemble fondamental de solutions du système homogène asso- 


+... n-/fr 
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cié & (1), la matrice-colonne 
Y= M + CX +... + C,_,x 
no bien écrite sous une forme développée, 


2 Yo x] Xi 
= ls 26, (hall are se » (14) 


nr 


Fe. Y x\ Xi 


est solution du système d'équations linéaires (1) pour tous nombres C,, … 
… C,_-,. Inversement, pour toute solution de ce système il existe des nom- 
bres C,, .., C,_, pour lesquels elle prend la forme (14). 

L'expression se trouvant dans le second membre de l'égalité (14) est 
appelée solution générale du système d'équations linéaires (1). 

Le théorème est vrai pour tout système d'équations linéaires et, en par- 
ticulier, pour les systèmes homogènes. La formule (14) devient équivalente 
à (13) si y, est une solution triviale. 

. La règle de Cramer affirme que pour l'existence et l’unicité de la solu- 
tion d’un système de 7 équations à ñ inconnues il suffit que le déterminant 
de la matrice du système soit différent de zéro. Le théorème 2 entraîne que 
cette condition est aussi nécessaire. 


PROPOSITION 6. Soit À la matrice du système de n équations linéaires à n 
inconnues. Si det À = 0, le système soit n'a pas de solutions, soit en a une 
infinité. 

DÉMONSTRATION. L'égalité det À = 0 signifie que le rang de la matrice À 
est strictement inférieur à ñn et, par suite, le système homogène associé a une 
infinité de solutions. Si le système considéré est compatible, il ressort de la 
formule (14) qu’il possède une infinité de solutions. 

6. Exemples. Soit 


Ax + By+Cz+D=0 (15) 


l'équation du plan rapporté à un repère cartésien. Traitons-la comme un 
système d’une seule équation linéaire à trois inconnues. Posons À # 0, 
c’est donc un mineur principal de la matrice du système. Le rang de la 
matrice complète est au plus égal à l’unité, si bien que le système est compa- 
tible. On peut trouver l’une de ses solutions en posant y = z = 0. On 
obtient x = — D/A. Vu que n = 3 et r = 1, le système fondamental des 
solutions du système homogène associé comprend deux solutions. On les 
obtient en donnant aux inconnues paramétriques deux couples de valeurs : 
y = 1,z = Oety = 0,z = 1. Les valeurs correspondantes de l’inconnue 
principale x sont alors — B/A et —-C/A. Ainsi donc, la solution générale 
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du système (15) est 


x — D/A — B/A — C/A 
yll = 0 +C, ] + C 0 
Z 0 0 1 (6) 


Dégageons le sens géométrique de la solution obtenue. Il est d’abord 
évident que la solution (— D/À, 0, 0) représente les coordonnées d’un point 
(initial) du plan ou, ce qui revient au même, les composantes de son rayon 
vecteur. Dans la formule (14), y, est une solution quelconque du système, 
ce qui correspond au fait que le point initial peut être choisi d’une façon 
arbitraire. Selon la proposition 2 du $ 2, ch. II, les composantes de tout 
vecteur situé dans le plan vérifient l’équation Aa, + Ba, + Ca, = 0, 
autrement dit le système homogène associé. À deux solutions linéairement 
indépendantes de ce système on peut faire correspondre deux vecteurs 
directeurs du plan. Ainsi, la formule (16) n’est autre chose que l’équation 
paramétrique du plan, où C; et C, sont des paramètres. L’arbitraire de 
choix du système fondamental de solutions se traduit donc par l’arbitraire 
de choix des vecteurs directeurs du plan. 

A titre d’un autre exemple, considérons une droite dans l’espace. Rap- 
portée au repère cartésien, elle peut être définie par un système d’équations 


Ax+ By+Cz +D,= “4. 
A,x + B,y + C;,z + D, = 0. 


Admettons que le mineur 4À,B, — A4,B, est différent de zéro et qu’il est 
donc principal. Vu que le rang de la matrice complète ne peut dépasser 2, le 
système est compatible. 

Pour exprimer les inconnues principales x et y en fonction de l’inconnue 
paramétrique z, il est naturel dans notre cas (le système de deux équations à 
coefficients littéraux) d'utiliser non pas la méthode de Gauss mais la règle 
de Cramer. 

Pour trouver une solution particulière du système, c’est-à-dire les com- 
posantes du rayon vecteur du point initial de la droite, posons z, = 0. Il 
vient 


(17) 


= B,D, — BD. _ D,A, -— DA, 
°  A,B, — AB, : TAB, = AB 
Le système homogène associé prend la forme 
A,x + B,y + CZ m4 (18) 
A,x + B,y + C;,z = 0. 


Son ensemble fondamental de solutions comprend une seule solution. En 
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donnant à l’inconnue paramétrique z la valeur z, = 1, on obtient de (18) 
- BC; — BC y, = CA: = GA, 

A,B, — A,B, | | AB, — A,B, | 
Toutefois il n’est plus commode de considérer ici l’ensemble fondamental 
normal de solutions. Multiplions dohc la solution trouvée du système 
homogène par À,B, — A,B,. Ainsi, la solution générale du système (17) 
est de la forme 


X; 


x X) B,C, — B,C, 
YII= rll + CIC, 4: — CA, |. (19) 
z 0 A,B, — A,B, 


La même forme du vecteur directeur de la droite a été obtenue dans la pro- 
position 11 du $ 2, ch. II. 


S 6. Multiplication des matrices 


1. Définition et exemples. Considérons d’abord une matrice-ligne a 
d'éléments a, (i = 1, .…, ñn) et une matrice-colonne b d'éléments b, (; = 
= }, .,n). Il est essentiel que dans a et b le nombre d'éléments soit le 
même. On appelle produit de a par b la somme des produits d'éléments de 
même numéro, c’est-à-dire 


ab = a,b, + a,b, + .…. + a,b,. 


Soient maintenant une matrice À à m lignes et nr colonnes et une matrice 
B à n lignes et p colonnes. Les matrices sont telles que le nombre de colon- 
nes de la première est égal au nombre de lignes de la seconde. Multiplions 
chaque ligne de À par chaque colonne de B. Ecrivons les mp produits obte- 
nus sous forme de matrice C à m lignes et p colonnes. Plus précisément, les 
éléments de chaque colonne de la matrice C sont les produits de toutes les 
lignes de la matrice À par la colonne correspondante de la matrice B, et les 
éléments de chaque ligne de C sont les produits de la ligne correspondante 
de À par toutes les colonnes de B. Ainsi, les éléments de la matrice C peu- 
vent être représentés par la formule : 


nñn 


ds D Gb (1) 
CS 


G=1,...,m; Jj = 1,...,p). 


DÉFINITION. On appelle produit d’une matrice À par une matrice B et on 
note AB la matrice C dont les éléments sont exprimés en fonctions des élé- 
ments de À et B par les formules (1). 
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La définition du produit des matrices est plus compliquée et paraît 
moins naturelle que celle de la somme. Cependant, si on essayait de définir 
le produit des matrices de mêmes dimensions comme la matrice obtenue en 
multipliant leurs éléments homologues, une telle définition ne trouverait 
guère d’applications importantes. Quant à la définition donnée, elle est, 
comme le lecteur s’en convaincra, largement utilisée. 

Considérons quelques exemples. 

1) Le produit d’une matrice carrée À d'ordre ñn par une matrice-colonne 
x à n éléments : 


al … a! x aix! + ....+ alx 
a … x" aix! +... + aix" 
AL | ss || ss = |Piraciorensaouse 
dd x” ax +... + x" 


Le produit est une matrice-colonne à n éléments. On ne peut multiplier les 
matrices dans l’ordre inverse, autrement dit xA n’est pas défini. 

2) Le produit d’une matrice-ligne à n°éléments par une matrice carrée 
d'ordre ñn est une matrice-ligne à #7 éléments : 


11 din 
n ñn 
Î 1] Fa nl a, X a, x 
à, .… X, RTS ns k! k .…. kn k 
k = ! ks 1! 
( AR D 


3) Le produit d’une matrice-colonne à m éléments par une matrice-ligne 
à n éléments est une matrice de type (m, ñn) : 


l ! l 
| xla,- Xlas: 5 la: 
x x'a, x?a, us x'a, 
la, Hé a, ï Ru iei. 
x" x"a, x"a, .… x"a, 


4) Soient À une matrice de type (m, ñ), e; la i-ième colonne de la matrice 
unité *) d'ordre m et e; la j-ième colonne de la matrice unité d'ordre n. 
Alors 


0 
a, da, 
e;Ae; = 10... 1... OÙ || ............ | = 4. 
da Le 
0 


*) Voir la définition de la matrice unité à la p. 131. 
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PROPOSITION 1. La j-ième colonne de la matrice AB est une combinaison 
linéaire des colonnes de À dont les coefficients sont égaux aux éléments de 
la j-ième colonne de la matrice B. 

La i-ième ligne de la matrice AB est une combinaison linéaire des lignes 
de B dont les coefficients sont égaux aux éléments de la i-ième ligne de la 
matrice À. 


Les deux assertions se démontrent de la même façon. Démontrons par 
exemple la première. Pour le faire, désignons les colonnes des matrices À, 
B et AB respectivement par a,, …, a,,b,, + D, et c,, Remarquons 
que les colonnes des matrices À et AB nt le même Le d’éléments. 
Etant donné que pour obtenir c; on multiplie successivement toutes les 
lignes de À par b,ona c; = Ab,;. Il ressort de l’exemple 1) que le produit 
Ab; peut être écrit : b; a + , + b,,a,, ce qui démontre la proposition. 

2. Proprietés de la multiplication des matrices. La multiplication des 
matrices n’est pas commutative. Même si les deux produits AB et BA sont 


définis, ils peuvent ne pas être égaux comme le montre l’exemple suivant : 
| ET LP ] 
O ON N1 1 00 1 1 11 1110 0 

Si deux matrices À et B vérifient la relation 4AB = BA, on dit qu'elles 


commutent ou sont commutables. De telles matrices existent. Par exemple 
la matrice unité d'ordre ñn 


1 O0 O0 0 O0 
E, =1[0 1 O 0 O0 
0 O0 O0 0 ! 
commute avec toute matrice carrée de même ordre, c’est-à-dire 
AË, = E,A = À. (2) 


Laissons au lecteur le soin de vérifier ces égalités à titre d’exercice sur la 
multiplication des matrices. 

Le fait qu’une matrice À ne change pas par multiplication par la 
matrice unité est une propriété importante de la matrice unité à laquelle elle 
doit son nom. Si une autre matrice Ë possédait la même propriété, on 
aurait ÊÉE = Eet ÉE = Ë, d'où E = 

Il va de soi que, quelles que soient les matrices À et B, on a 


AO = O, OB = O, 
où O est la matrice nulle. (On admet que les produits sont définis.) 


PROPOSITION 2. La multiplication des matrices est associative, c'est-a- 
11 —6442 
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dire si les produits AB et (AB)C sont définis, il en est de même de BC et de 
A(BO©), de sorte qu'on a l'égalité (AB)C = A(BC). 


En effet, soient les matrices À, B et C de types respectifs (m,, n,), 
(ne, 15) et (Mc, NC). S\ AB est défini, n, = m, et la matrice AB est de type 
(m,,n,). Donc, si le produit (4B)C est défini, n, = me. Les éléments de 
la matrice 4B sont 

n A 
D) a b,, G=1,..,m,;p=1,...,n,) 


«œ = | 


et, par suite, ceux de (AB)C sont de la forme 


ng LD 
y ( y dub Ga (: = 1,...,m, s À = 1, ss 1). (3) 


n = | œ = | 


Puisque 7, = m,., le produit BC est défini. Ses éléments sont 


D Cx («=1,...,m,;X=1,...,n0. 


1 LA 3 


Le nombre de lignes de la matrice BC est égal à n,, autrement dit au nom- 
bre de colonnes de la matrice 4. Ainsi est défini le produit 4 (BOY). Les élé- 
ments de À (BC) sont de la forme 


ñ A 
y a; ( 
= | ; 


Œœ = 


18 
ÿ bc) G=1,....m,;1=1,...,n0). (4) 
= | 


>) = 


En vertu des propositions 1 et 2 du $ 2, les expressions (3) et (4) coïncident, 
si bien que la proposition 2 est démontrée. 


PROPOSITION 3. La multiplication des matrices est distributive par rap- 
port à l'addition, c'est-à-dire si A(B + C) est définie, on a 


A(B + C) = AB + AC. 


Si (A + B)C est définie, on a 
(A + B)C = AC + BC. 


Les deux parties de la proposition se démontrent de la même façon. 
Démontrons par exemple la première. Il est évident que B et C doivent être 
de type (m1, ñn), et À de type (p, m) (p peut être quelconque). On peut expri- 
mer les éléments de la matrice A(B + ©) en fonction des éléments des 
matrices À, Bet C : 


à a,;(b,, + c..) (\= 1:20 1,240). 


! l 


Selon la proposition 1 du $ 2, cette somme peut être représentée sous la 
forme 


m nm 
ÿ ab, + Ÿ ac. 
1.1 im 

Les sommes qui composent cette expression sont égales aux éléments des 
matrices AB et AC, situés à l'intersection de la ligne de numéro X et de la 
colonne de numéro a. La proposition est ainsi démontrée. 

On démontre aisément la propriété suivante de la multiplication des 
matrices. 


PROPOSITION 4. Si le produit AB est défini, on a 
a(AB) = («AÀ)B = A(œB) 
pour tout nombre à. 


ProposiTionS. Le rang du produit de deux matrices ne dépasse pas les 
rangs des facteurs. 


Pour le démontrer, considérons une matrice D composée de toutes les 
colonnes des matrices À et AB. Ecrivons-la sous la forme : D = A1 AB. 
Il est évident que Rg AB < R£g D. Selon la proposition 1, les colonnes de 
AB sont des combinaisons linéaires des colonnes de À. D'où il ressort que 
Rg D = RgA. On a RgAB < RgA. De façon analogue on démontre que 
Rg AB < RgB. Il faut pour cela considérer la matrice D’ composée des 
lignes de la matrice B et des lignes de la matrice AB. 


PROPOSITION 6. Si le produit AB est défini, il en est de même du produit 
(B'A et on a l'égalité 
((AB) = 'B'A. 


Supposons que les matrices À et B sont respectivement de types (m, n) 
et (7, p). L'élément de la matrice AB situé à l’intersection de la ;-ième ligne 
et de la j-ième colonne est alors de la forme 


n 


y Gad (G=1,...,mMm; j= 1,...,p). (5) 


a = | 


La j-ième ligne de la matrice !B est composée des éléments b, joe. b,;, tan- 
dis que la i-ième colonne de la matrice "4 des éléments a, …, a, . Donc, le 
produit ‘B'A est défini, et l’élément situé à l’intersection de la j-ième ligne 


et de la ;-ième colonne est de la forme 


Il se confond avec l'élément (5), les indices j et j parcourant dans les deux 
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expressions les mêmes valeurs à = 1, ..., m ; j = 1, ..., p. La proposition 
est ainsi démontrée. 


CoROLLAIRE. Si le produit ABC est défini, on a 
((ABC) = 'C'B'A. 


En effet, '(4BC) = 'C'(AB) = 'C'B'A. 
3. Matrice inverse. Etudions maintenant les possibilités d'introduire 
l'opération de division qui est l’inverse de celle de multiplication. 


DÉFINITION. Etant donné une matrice À, on dit que X est la matrice 
inverse de À, et on la note À7!, si 


XA=AX=E,, (6) 


où E, est la matrice unité d'ordre n. 

Puisque À et À 7! commutent, elles doivent toutes les deux être carrées 
et de même ordre n. En effet, il ressort de (6), en vertu de la proposition 5, 
que RgE, < Rg À. D'où Rg À = n. Par suite, la matrice À peut avoir une 
inverse si son déterminant n’est pas nul. La condition mentionnée est non 
seulement nécessaire mais aussi suffisante pour que la matrice inverse 
existe. 


PROPOSITION 7. Toute matrice carrée de déterminant non nul admet une 
matrice inverse et une seule. 


DÉMONSTRATION. Pour toute matrice À, avec det À # O0, il existe une 
matrice X et une seule telle que 4X = E. En effet, la colonne x; de la 
matrice X doit satisfaire pour tout ; à la condition Ax., = e;, où e; est la 
j-ième colonne de la matrice unité. De façon plus détaillée, cette condition 
s’écrit par un système d’équations linéaires 


1 _ 
a;1X; + .… + a,,X° ci 0, 


ax! +... +ax= I], (7) 


D’après la règle de Cramer, ce système d’équations admet une solution uni- 
que et, par suite, chaque colonne de la matrice X est parfaitement définie. 

Démontrons que XA = E. A cet effet remarquons que det X + 0, de 
sorte que d’après ce qui vient d’être démontré il existe une matrice Y telle 
que X Y = E. On obtient Y en multipliant à gauche les deux membres de la 
dernière égalité par la matrice À. Il vient AXY = À, d’où, en vertu de 
AX = E,ona Ÿ = À. Ainsi donc, la matrice X satisfait aux deux condi- 
tions (6). 
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Le procédé utilisé dans la démonstration de l’existence sert de base dans 
la recherche de la matrice inverse. Selon la règle de Cramer, on obtient la 
i-ième inconnue du système (7) à partir de la formule x = A,/det À, où A, 
est le déterminant de la matrice déduite de À par substitution à sa i-ième 
colonne de la j-ième colonne de la matrice unité. En développant A; suivant 
cette colonne, on obtient un seul terme car un seul élément dans e; est égal 
à 1, les autres étant des zéros. Par conséquent, A, = (—1}*/M{, où Mi est 
le mineur associé à l’élément & dans la matrice 4. En définitive : 

re 
x; = CIM; . (8) 
det À 

Le système (7) peut également être résolu par la méthode de Gauss. 
Puisque det A + 0, le corollaire de la proposition 3 du $ 4 nous dit qu’il est 
possible de transformer la matrice À en matrice unité par les opérations élé- 
mentaires sur les lignes de la matrice complète du système. Ceci étant, la 
matrice-colonne des termes constants e; devient la solution x; du système 
(comp. les formules (7) du $ 5, qui dans le cas considéré ne contiennent pas 
d’inconnues paramétriques). 

Pour les ; différents, les systèmes (7) ne se distinguent que par les 
matrices-colonnes des termes constants. Aussi les opérations élémentaires 
sur les lignes de la matrice complète sont-elles les mêmes pour tous les /. On 
peut résoudre tous les systèmes à la fois en joignant à À toutes les colonnes 
des termes constants des systèmes : 


a, … all 0 … 0 0 
A : (9) 
a, a, |O O0 0 1! 


On obtient de ce qui vient d’être dit que si les opérations élémentaires 
sur les lignes de la matrice (9) transforment sa partie gauche en matrice 
unité, sa partie droite devient la matrice 4-!. 

Citons quelques propriétés de la matrice inverse : il découle immédiate- 
ment de la definition que 


(4=1)-! = A. 
En outre, 
(AB)-! = B-!'A-1, (10) 
(CA)! = (471). (11) 


Vérifions la formule (10) : 
AB(B-'A-!) = A(BB-')A-! = E. 


Pour démontrer la formule (11), transposons les deux membres de 


166 SYSTÈMES D'EQUATIONS LINÉAIRES ET MATRICES ICH.V 


l'égalité 4AA-! = E. On obtient ‘(4-!)'A = E, d’où se déduit la formule 
(11). 

4. Transformations élémentaires en tant que multiplication des matri- 
ces. Déterminant du produit. Toute transformation élémentaire de lignes 
d’une matrice À à m lignes et n colonnes est équivalente à la multiplication 
à gauche de À par une matrice carrée d'ordre m. Plus précisément, considé- 
rons la matrice S, déduite de la matrice unité par permutation des lignes i et 
j. I ressort immédiatement de la proposition 1 que la multiplication à gau- 
che de À par S, fait changer l’ordre des lignes correspondantes dans la 
matrice À. 

Soit S, la matrice déduite de la matrice unité par substitution de À # 0 
à 1 situé à la ;-ième position sur la diagonale. Il découle de la proposition 1 
que la i-ième ligne de la matrice obtenue par multiplication à gauche de À 
par $, se trouve multipliée par À. 

Notons S, la matrice obtenue de la matrice unité en substituant l'unité à 
l'élément nul situé à l'intersection de la i-ième ligne et de la j-ième colonne. 
La multiplication à gauche de À par S, s’avère équivalente à l’addition de 
la j-ième ligne de À à la i-ième. 

Signalons que les déterminants de S,, $, et S, sont différents de zéro : 
det S, = —]1,detS, = X, detS, = 1. Si À est une matrice carrée, on a 


det(S,A) = —det A, det(S,A4) = Adet A, det(S,4) = det À. 
Ainsi, pour les matrices de transformations élémentaires, : 
det (SA) = det S det À. (12) 


Aux transformations élémentaires successives correspond la multiplica- 
tion à gauche par le produit des facteurs matriciels correspondants. 

On peut réaliser les transformations élémentaires des colonnes de À par 
multiplications à droite de À par des matrices analogues. 


PROPOSITION 8. Si det À # 0, il existe des matrices de transformations 


élémentaires S,, …, S, telles que A = S, ss, 


DEMONSTRATION. Si det À # 0, il existe ÀA-!. Vu que det 4”! # 0, les 
opérations élémentaires sur les lignes de la matrice 4! permettent de la 
transformer en matrice unité. Il existe donc des matrices de transforma- 
tions élémentaires S,, ..…, S, pour lesquelles S, … S, A7! = E. Ce sont évi- 
demment les matrices cherchées. 

On est maintenant en mesure de démontrer la 


PROPOSITION 9. Pour toutes matrices carrées À et B du même ordre, 
det (AB) = det À det B. 


En effet, si det À = 0, l’assertion découle de la proposition 5 sur le 
rang du produit des matrices. Mais si det À # 0, la matrice À peut être pré- 
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sentée sous forme de produit des matrices de transformations élémentai- 
res : À = S, … S, - En appliquant maintenant la formule (12), on obtient 


det (4B) = det (S, … S, B) = det S, … det S, det B = det À det B. 


S. Matrices complexes. Les propriétés des quatre opérations arithméti- 
ques étant les mêmes pour les nombres réels aussi bien que pour les nom- 
bres complexes, toutes les assertions sur les nombres réels où n'intervien- 
nent que ces propriétés sont aussi vraies pour les nombres complexes. En 
particulier, par analogie au $ 2, on peut définir le déterminant de la matrice 
carrée dont les éléments sont des nombres complexes. De par la définition 
c'est un nombre complexe, et toutes les propositions démontrées au $ 2 
demeurent vraies. 

En étudiant les systèmes d’équations linéaires dans les $$ 3, 4 et S on 
n’a utilisé que les propriétés de l'addition, de la soustraction, de la multipli- 
cation et de la division, qui sont les mêmes pour les nombres réels et com- 
plexes. Donc, tout ce qui a été démontré s’applique aussi aux systèmes 
d'équations linéaires à coefficients et seconds membres complexes. 

Les matrices à éléments complexes vérifient tout ce qui a été dit sur les 
matrices dans les $$ 1 et 6. La définition et les propriétés de l’addition et de 
la multiplication des matrices, y compris la construction de la matrice 
inverse, sont formulées et démontrées de façon identique pour les nombres 
réels et complexes. 

A proprement parlé, dans les paragraphes précédents on n’a pas spéci- 
fié la nature des nombres, ce qui d’ailleurs n’était pas nécessaire vu que 
tout ce qui a été dit se rapportait dans la même mesure aux nombres réels et 
complexes. Soulignons toutefois que dans les combinaisons linéaires de 
matrices-colonnes à éléments complexes on peut prendre pour coefficients 
des nombres complexes quelconques. 

Arrêtons-nous sur quelques particularités des matrices complexes. 
Soient z,, les éléments de la matrice Z. Siz,; = a,; + b,;, la matrice Z peut 
être représentée sous la forme 


Z = À + Bi, 


où les matrices 4 et B sont composées d'éléments a, jet b, respectivement. 
On appelle À partie réelle et B partie imaginaire de la matrice Z. Deux 
matrices complexes Z et Z, sont égales si et seulement si À = 4, et 
B = B,. Ainsi, à une égalité de deux matrices complexes correspondent 
deux égalités entre les matrices réelles. On remarque ici une coïncidence 
parfaite avec l'égalité des nombres complexes. 

La matrice composée d'éléments 4, est appelée conjuguée de la matrice 
Z'et est notée Z. Pour toutes les matrices complexes on a 


Z.+2=2, +2, (13) 
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ZZ, = 22. (14) 


det Z = detZ (5) 
(à condition que la somme, le produit et le déterminant qui figurent dans 
l’un des membres de l'égalité soient définis). 


En démontrant la dernière relation, on peut se servir du développement 
(6) du $ 2. Il vient 


duZ= Y (1) #7, = 
Ur. Jn) 


- >) e 1)"0r ue 0 de = det Z. 
Ur + Jn) 


Les égalités (13) et (14) se démontrent de la même façon. 

Une matrice est réelle (c’est-à-dire est composée de nombres réels) si et 
seulement si elle est égale à sa matrice conjuguée. En effet, chacun de ses 
éléments est égal dans ce cas à son conjugué. 


CHAPITRE VI 


ESPACES VECTORIELS 


& 1. Notions générales 


1. Définition d’un espace vectoriel. Dans ce livre, on a déjà rencontré 
des ensembles munis des opérations d’addition et de multiplication par un 
nombre. Dans le chapitre I par exemple, on a considéré l’ensemble des vec- 
teurs (segments orientés) dans lequel à tout couple de vecteurs on a associé, 
suivant la règle du parallélogramme, un vecteur appelé leur somme, et à 
tout vecteur a et tout nombre «, un vecteur appelé produit de a par @. 

Dans l’ensemble des matrices de mêmes dimensions, on a introduit 
l’opération d’addition en appelant somme de deux matrices la matrice dont 
les éléments sont égaux aux sommes des éléments homologues des termes. 
On a de même introduit l'opération de multiplication d’une matrice par un 
nombre : ce produit est la matrice dont les éléments sont les produits des 
éléments de la matrice donnée par ce nombre. Si les éléments de la matrice 
sont des nombres complexes, on peut aussi définir le produit de cette 
matrice par un nombre complexe. On a vu que les propriétés de ces opéra- 
tions, exprimées dans la proposition 1 du $ 1, ch. V, étaient les mêmes que 
celles des opérations sur les vecteurs formulées dans la proposition 1 du 
$ 1, ch. I. 

Bien que définies de façon différente dans chacun de ces ensembles les 
opérations considérées ont des propriétés communes : commutativité et 
associativité de l’addition, distributivité de la multiplication par un nombre 
relativement à l’addition des nombres, etc. Dans les calculs des vecteurs ou 
des matrices, on n'utilise que ces propriétés sans faire intervenir les défini- 
tions des opérations. On donnera plus loin d’autres exemples d’ensembles 
où sont définies des opérations possédant les mêmes propriétés. 

Il devient, tout naturellement, nécessaire d’étudier un ensemble de 
nature quelconque où sont définies les opérations d’addition de deux élé- 
ments et de multiplication d’un élément par un nombre. Ces opérations 
peuvent être définies de façon quelconque à condition qu’elles possèdent 
une gamme de propriétés bien déterminée. 
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DÉFINITION. L’ensemble _/ sera appelé espace vectoriel et ses éléments 
vecteurs Si : 

1) est définie une loi de composition interne (opération d’addition) sui- 
vant laquelle à deux éléments quelconques x et y de “est associé un élé- 
ment appelé leur somme, noté x + y ; 

2) est définie une loi de composition externe (opération de multiplica- 
tion par un nombre) suivant laquelle à un élément x de “et à un nombre « 
est associé un élément de _/ appelé.produit de x par æ, noté ax ; 

3) pour tous éléments x, y et z de “et tous nombres a et B, sont rem- 
plies les conditions (ou axiomes) suivantes : 

Ox+y=Y7+x; 

ZX + +z=Xx+0 +2); 

3° il existe un élément o tel que pour tout x de on ax + 0 = x; 

4 pour chaque x il existe un élément —x tel que x + (—x) = 0; 

S° œ(x + y) = ax + «y; 

6 (œ + B})x = ax + Bx ; 

T° œ(Bx) = (œB)x ; 

8 le produit de tout élément x par le nombre 1 est égal à x, c’est-à-dire 
1x = x. 

Si au point 2) on se limite aux nombres réels, “est appelé espace vecto- 
riel réel ; si est définie la multiplication par tout nombre complexe, l’espace 
vectoriel est dit complexe. 

Le vecteur — x est dit opposé du vecteur x. Le vecteur o est appelé vec- 
teur nul ou zéro. 

On désignera les vecteurs par des lettres latines minuscules et les nom- 
bres par des lettres grecques. 

Donnons encore quelques exemples d’espaces vectoriels. 


EXEMPLE 1. Considérons l’ensemble de toutes les fonctions d’une varia- 
ble indépendante £, définies et continues pour 0 < £ < 1. A deux fonc- 
tions quelconques /(£) et g(£) de cet ensemble on peut associer leur somme 
f(E&) + g(£) qui est aussi une fonction définie et continue pour 0 < Ë£ < 1 
et qui, par suite, appartient à l’ensemble considéré. À un nombre « et à une 
fonction f(£) on peut associer une fonction æf{(£) (produit banal d’une 
fonction par un nombre) qui est définie et continue pour 0 < £ < 1sila 
fonction f(£) l’est. Les huit axiomes sont vérifiés. Le rôle de zéro est joué 
par la fonction identiquement nulle. 


EXEMPLE 2. Soit l’ensemble de tous les polynômes d’une seule varia- 
ble, dont le degré est au plus égal à un nombre donné n. La somme de deux 
polynômes de est également un polynôme de degré au plus égal à nr ; de 
même, le produit d’un polynôme de _/ par un nombre appartient à “ On 
vérifie facilement que les axiomes de l’espace vectoriel sont aussi vrais dans 
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ce cas. Le rôle de zéro est joué par le polynôme dont tous les coefficients 
sont nuls. est un espace vectoriel réel ou complexe suivant que les coeffi- 
cients des polynômes sont réels ou complexes. 


EXEMPLE 3. L'ensemble des nombres complexes muni des opérations 
d’addition et de multiplication par un nombre complexe est un espace vec- 
toriel complexe. D’une façon analogue, l’ensemble des nombres réels muni 
des opérations ordinaires d’addition et de multiplication est un espace vec- 
toriel réel. 


ExeMPLe 4. L'ensemble des nombres complexes muni des opérations 
ordinaires d’addition et de multiplication par un nombre réel constitue un 
espace vectoriel réel. 


EXEMPLES. Il existe un espace vectoriel composé d’un seul élément. Cet 
espace est dit z7u/. L'élément unique y joue à la fois le rôle de zéro et de son 
propre opposé. Les opérations sont définies par les égalités o + o = oet 
ao = O. 

2. Corollaires immédiats. Il ressort des axiomes de l’espace vectoriel 
qu'il existe un vecteur nul et un seul et que chaque vecteur admet un vecteur 
opposé et un seul. En effet, supposons qu'il existe deux vecteurs o, et o, 
vérifiant l’axiome 3°. Leur somme doit alors être égale à chacun d’eux : 
0, + 0, = 0, = 0,. D'une façon analogue, si un vecteur x possède deux 
vecteurs Opposés —x, et —x,, la somme (—x,) + x + (— x.) doit être égale 
à —x, et —x;. 

L'égalité o + o = o veut dire que l’opposé du vecteur nul est le vecteur 
nul, tandis que l'égalité (—x) + (x) = o signifie que l’opposé du vecteur 
— x est le vecteur x. 

La somme des vecteurs y et —x sera notée y — x et appelée différence 
des vecteurs y et x. 

On voit aisément que tout vecteur x vérifie l'égalité Ox = o. En effet, 


Ox = OX +x - x = (1 + O)x — x = o. 
Il en découle que (—1)x = —x pour tout x. En effet, 
(—1)x + x = (1 — 1)x = Ox = o. 
Signalons de même que le produit de tout nombre par le vecteur nul est 
égal au vecteur nul, puisque 
ao = œ(x — X) = ax — ax = o. 
Si ax = o, on a : ou bien « = 0, ou bien x = o. En effet, soit æ # 0. 
On peut alors multiplier l’égalité donnée par &7! et obtenir 1x = o. 
L'expression de la forme aœ,x, + ... + a,x, sera appelée, comme dans 


les chapitres précédents, combinaison linéaire des vecteurs x,, ..., x, avec 
coefficients æ,, …., @,. 
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De tout ce qui vient d’être dit il ressort que les opérations sur les vec- 
teurs dans un espace vectoriel sont effectuées suivant les mêmes règles que 
les opérations sur les vecteurs (segments orientés) de l’espace géométrique 
ordinaire. 

3. Dépendance linéaire. Par analogie avec les définitions respectives 
pour les vecteurs et matrices-colonnes introduites dans les chapitres I et V, 
on définit le systéme libre et le système lié de vecteurs dans un espace vecto- 
riel. Rappelons qu’une combinaison linéaire est dite nee si tous ses coef- 
ficients sont nuls. 


DÉFINITION. On dit qu’un système de vecteurs est lié s’il existe une com- 
binaison linéaire non triviale de ces vecteurs qui est égale à zéro. Dans le cas 
contraire, c’est-à-dire lorsque la seule combinaison linéaire triviale des vec- 
teurs est nulle, on dit que le système de vecteurs est libre. 

Toutes les propositions démontrées pour les systèmes libres et liés de 
matrices-colonnes sont également vraies pour les systèmes de vecteurs. On 
se limitera ici à l'énoncé de ces propositions, car leurs démonstrations sont 
identiques à celles des propositions sur les matrices-colonnes (voir proposi- 
tions 2 à 5,$ 1, ch. V). 


PROPOSITION 1. Un système de k > 1 vecteurs est lié si et seulement si au 
moins un des vecteurs est une combinaison linéaire des autres. 


PROPOSITION 2. Tout système qui contient le vecteur nul est lié. 


PROPOSITION. Le système de vecteurs est lié s'il contient un ensemble de 
vecteurs linéairement dépendants. 


PROPOSITION 4. Tout système extrait d'un système de vecteurs libre est 
encore libre. 


4. Base. La définition suivante jouera un grand rôle dans l’exposé qui 
suit. 


DÉFINITION. On dit que le système fini et ordonné de vecteurs est une 
base de l’espace _/si : a) il est libre et b) tout vecteur de “est une combinai- 
son linéaire des vecteurs de ce système. 

Notons que la base est par définition un système ordonné de vecteurs. 
Cela signifie qu’à chaque vecteur est attaché un numéro. En changeant 
l’ordre des vecteurs, on peut obtenir des bases différentes à partir d’un 
même système. 

Les coefficients de la combinaison linéaire dont il s’agit dans la défini- 
tion s’appellent composantes ou coordonnées du vecteur dans la base don- 
née. 

On écrira les vecteurs e,, .…, e, de la base sous la forme d’une matrice- 
ligne :e = Île, … e, ll et les composantes £!, …, £” du vecteur x dans la base 
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e sous la forme d’une matrice-colonne : 
£! 
£" 
qu'on appellera colonne de coordonnées du vecteur. 
On peut maintenant écrire le développement du vecteur x suivant les 
vecteurs de base sous l’une des formes suivantes*) 
: Et||. 
dE y £'e, = lle, el - || || = eë. 
ja En 


PROPOSITIONS. Etant donné une base, les composantes de tout vecteur 
sont définies de façon univoque. 


Dans le cas contraire, on aurait deux égalités x = L£'e.etx = L£!e,, 
d'où Y(£' — £' Je, = O0. Puisque les vecteurs e,, .…, e, sont linéairement 
indépendants, tous les coefficients de la combinaison linéaire sont nuls et, 
par suite, £' = £! pour tous i = 1,..,n. 


PROPOSITION 6. La colonne de coordonnées de la somme de deux vecteurs 
est égale à la somme de leurs colonnes de coordonnées. La colonne de coor- 
données du produit d’un vecteur par un nombre est égale au produit de la 
colonne de coordonnées du vecteur donné par ce nombre. 


Pour le démontrer, il suffit d'écrire les suites d’égalités : 


X+y=eE +en = e(£ +1) 
t 
| ax = aet = e(af), 


où £ et 7 sont les colonnes de coordonnées des vecteurs x et y. On se sert ici 
des propriétés de multiplication des matrices (propositions 3 et 4 du $ 6, 
ch. V). 

Il ressort immédiatement de la proposition 6 que la colonne de coor- 
données de la combinaison linéaire des vecteurs est une combinaison 
linéaire de leurs colonnes de coordonnées avec les mêmes coefficients. 
D'où il découle la 


PROPOSITION 7. Les vecteurs sont linéairement dépendants si et seulement 
si leurs colonnes de coordonnées sont linéairement dépendantes. 


La démonstration est évidente : si la combinaison linéaire non triviale 


*) Les éléments de la matrice-ligne e sont des vecteurs et non des nombres. On peut éten- 
dre à ces matrices-lignes toutes les opérations sur les matrices. 
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des vecteurs est nulle, il en est de même de la combinaison linéaire, avec les 
mêmes coefficients, de leurs colonnes de coordonnées. La proposition réci- 
proque se démontre de la même façon. 


THÉORÈME 1. Si dans un espace vectoriel il existe une base de n vecteurs, 
tout autre base de cet espace est aussi composé de n vecteurs. 


En effet, soient dans l’espace deux bases Île,, ..…., e Ï et Uf,, .…, fl, 
avec m > n. Décomposons chacun des vecteurs f,, .…, f,, suivant les vec- 
teurs e,, .…, e, et construisons une matrice dont les colonnes sont les colon- 
nes de coordonnées obtenues. On a m matrices-colonnes dont chacune a n 
éléments. La matrice ainsi obtenue a donc n lignes et m7 colonnes et son 
rang ne dépasse pas 7. En vertu du théorème 2 du $ 4, ch. V, les colonnes 
de la matrice sont linéairement dépendantes et, partant, sont dépendants 
les vecteurs f,, …, f,, : contradiction. 

On est maintenant en droit d'introduire la définition suivante. 


DÉFINITION. Un espace vectoriel muni d’une base de n vecteurs est dit de 
dimension n ou n-dimensionnel. 

Dans l’espace nul il n’y a pas de base, car le vecteur nul forme un 
système lié. La dimension de l'espace nul est par définition égale à zéro. 

Il peut arriver que, quel que soit l’entier naturel m, il existe dans 
l’espace _“un système de m7 vecteurs linéairement indépendants. Cet espace 
est dit alors de dimension infinie. I] n’a pas de base. 

EXEMPLES. 1) L'ensemble des vecteurs du plan représente un espace 
vectoriel de dimension deux, et l’ensemble de tous les vecteurs de l’espace, 
que l’on étudie en géométrie élémentaire, un espace vectoriel de dimension 
trois (voir propositions 7 et 8 du $ 1, ch. I). 

2) L'espace vectoriel des matrices-colonnes à #7 éléments est de dimen- 
sion 7. En effet, les colonnes de la matrice unité d’ordre n sont linéaire- 
ment indépendantes (voir exemple, p. 126) et toute matrice-colonne à n élé- 
ments est leur combinaison linéaire (proposition 7, $ 1, ch. V). L’espace 
vectoriel des matrices-colonnes à nr éléments s’appelle espace arithmétique 
de dimension n. 

3) L'espace vectoriel des fonctions d’une seule variable indépendante £, 
définies et continues pour 0 < £ < 1, est de dimensioninfinie. Pour le véri- 
fier, il suffit de démontrer que pour tout mn il existe dans cet espace m1 vec- 
teurs linéairement indépendants. Soit un entier naturel m. Considérons m 
vecteurs (fonctions) de cet espace : £9 = 1,£,£2,...,£m-1, Ils sont linéai- 
rement indépendants. En effet, si la combinaison linéaire de ces vecteurs 
avec coefficients æ,, .…, æ,,_, est égale au vecteur nul, le polynôme 


Gp + QE + GE? + …. + a, _ ET! 


est identiquement nul, ce qui n’est possible que si tous ses coefficients sont 
nuls. 
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L’algèbre linéaire étudie les espaces vectoriels de dimension finie. On 
supposera donc plus loin partout, à l’exception de quelques exemples, que 
l’espace est de dimension finie. 

Dans un espace de dimension finie il existe une infinité de bases diffé- 
rentes. Ceci découle des propositions suivantes qu’on utilisera dans la 
suite. 


PROPOSITIONS. Dans un espace de dimension n, tout système ordonné de 
n vecteurs linéairement indépendants est une base. 


En effet, étant donné un tel système de vecteurs, chaque vecteur de 
l’espace se décompose suivant ces vecteurs, car, autrement, il y aurait dans 
l’espace n + 1 vecteurs linéairement indépendants. 


ProposiTion 9. Dans un espace de dimension n tout système libre 
ordonné de k < n vecteurs peut être complété jusqu'a une base. 


Cela découle du fait qu’à tout système de vecteurs linéairement indé- 
pendants on peut toujours ajouter un vecteur qui n’est pas leur combinai- 
son linéaire. (S'il n’en était pas ainsi, le système serait lui-même une base.) 
On obtient donc # + 1 vecteurs linéairement indépendants. Si # + 1 < n, 
on reprend les raisonnements et on agit de la sorte jusqu’à ce qu’on 
n’obtienne 7 vecteurs linéairement indépendants, dont les £ vecteurs don- 
nés. 

En particulier, on peut compléter jusqu’à la base tout vecteur non nul. 

S. Changement de base. Etant donné deux bases lle,, …, el et le, , … 
…, €, À dans un espace de dimension #, on peut développer chaque vecteur 
de la base le,, …, el suivant les vecteurs e,, …, e, : 


n 
e' = y ce, (= 1,...,n). (1) 
J=1 
Les composantes o/ peuvent être écrites sous forme d’une matrice carrée 
d’ordre n : 


0! + ‘@ 
à à 
dde 
 … 


Les colonnes de la matrice S représentent les colonnes de coordonnées des 
vecteurs e,, …, e, dans la base e. Par suite, les colonnes de la matrice S 
sont linéairement indépendantes et det S # 0. 


DÉFINITION. La matrice dont la j-ième colonne représente la colonne de 
coordonnées du vecteur e; dans la base e s’appelle matrice de passage de la 
base e à la base e:. 
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L’égalité (1) peut être écrite en notations matricielles : 


le, ….e' = lle, ….e ls, (2) 
ou 
e =es, 


ce qui se vérifie aisément par multiplication de ces matrices. 
En multipliant à droite les deux membres de l’égalité (2) par la matrice 
S”!, on obtient 
e=e S"!, 
d’où il découle que S- ! est la matrice de passage de e’ à e. 


PROPOSITION 10. Etant donné la base e, toute matrice S de déterminant 
non nul est la matrice de passage de e à une base e:. 


En effet, si det S Æ 0, les colonnes de la matrice S sont linéairement 
indépendantes. Ce sont les colonnes de coordonnées de nr vecteurs linéaire- 
ment indépendants constituant la base recherchée e:. 

Voyons comment sont liées les composantes d’un même vecteur dans 
deux bases e et e’. Considérons le vecteur x et notons £ et £” ses colonnes 
de coordonnées par rapport aux bases e et e”. Cela signifie en particulier 
que x = e £”. Portons-y l'expression de e” par l’intermédiaire de e et de la 
matrice de passage de la base e à la base e'. On obtient x = eS£’. Or, 
x = ef. En comparant les deux dernières expressions, on a, en vertu de 
l’unicite du développement du vecteur x suivant les vecteurs de base, 


£ = SE. (3) 
Sous une forme plus détaillée, cette formule peut être écrite 
£! ol … ol £"1 
En 07 .… où En 
ou, si l’on effectue ia multiplication des matrices, 
= D ati (G=1,..,n). (4) 
J=1 


Ce résultat a déjà été obtenu pour l’espace de dimension trois (formule (2), 
$ 4, ch. I). 


$ 2. Sous-espace vectoriel 
1. Définition et exemples. Dans un espace géométrique ordinaire, la 


somme des vecteurs d’un plan appartient aussi à ce plan, de même que le 
produit du vecteur par un nombre. Des propriétés analogues ont lieu pour 
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les vecteurs portés par une droite. Dans un espace vectoriel la généralisa- 
tion du plan et de la droite est la notion de sous-espace vectoriel. 


DÉFINITION. On dit qu’un ensemble non vide _/" de vecteurs dans un 
espace vectoriel “est un sous-espace vectoriel si : a) la somme des vecteurs 
quelconques de _/” appartient à ” et b) le produit de tout vecteur de 
par un nombre quelconque appartient aussi à _/”. 

Le lecteur démontrera sans difficulté qu’en vertu de cette définition, 
toute combinaison linéaire de vecteurs de _“" appartient à /". En particu- 
lier, le vecteur nul, en tant que produit 0x, doit se trouver dans /". De 
même, pour tout vecteur x de /”, le vecteur opposé, égal à — 1x, se trouve 
dans /”. 

L’addition et la multiplication par un nombre, introduites dans l’espace 
_/, se définissent de la même façon dans son sous-espace _/”". Tous les axio- 
mes de l’espace vectoriel sont vérifiés pour /” car ils le sont pour _/. Ainsi 
donc, tout sous-espace vectoriel a une structure d’espace vectoriel. 


EXEMPLE 1. Soit donné un ensemble .#de vecteurs dans l’espace vectoriel 
, Notons /” l’ensemble de toutes les combinaisons linéaires dont cha- 


cune a un nombre fini de vecteurs appartenant à «* L'ensemble /” est un 
sous-espace dans _“. En effet, si x et y appartiennent à “",ona 


n n 
X = > XP; V— D H;j4;s 
im J=1 

où tous les p, et q, appartiennent à :* On voit que x + y = ZAÀp, + 
+ ÿ H;Q; c'est-à-dire que la somme est toujours une combinaison linéaire 
d’un nombre fini de vecteurs de D'une façon analogue, pour le vecteur 
x = LÀp;ona ax = L(aÀ,)p.. 

Le sous-espace /” ainsi construit s'appelle enveloppe linéaire de 
l’ensemble .Z 

Soit {p,, …, p,,} un système libre de vecteurs de :#tel que chaque vec- 
teur de :Zest une combinaison linéaire de ces vecteurs. (Si l’espace est de 
dimension finie, un tel système existe évidemment dans tout ensemble qui 
contient des vecteurs non nuls.) Les vecteurs p,, .…, p,, constituent une base 
dans l’enveloppe linéaire de l’ensemble . En effet, toute combinaison 
linéaire de vecteurs de :# peut être représentée comme une combinaison 
linéaire des vecteurs p,, …, p,,, Car il est toujours possible de développer 
chaque vecteur de % suivant p,, .…, p,, et de porter les développements 
obtenus dans la combinaison linéaire étudiée. 

En particulier si est un ensemble fini de vecteurs on a la 


PROPOSITION1. La dimension de l'enveloppe linéaire d’un ensemble fini 
de vecteurs ne dépasse pas le nombre de ces vecteurs. 


12—6442 
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ExEMPLE2. Considérons un système homogène d’équations linéaires à # 
inconnues. L'ensemble de toutes les solutions de ce système représente un 
sous-espace de l’espace vectoriel des matrices-colonnes à #7 éléments. 

Pour le démontrer, il suffit de se rappeler les propriétés des solutions du 
système homogène (proposition 3, $ 5, ch. V). 

Tout système fondamental de solutions du système d’équations consi- 
déré est une base de ce sous-espace. 


EXEMPLE 3. Dans tout espace vectoriel, l’ensemble constitué d’un seul 
vecteur nul est un sous-espace vectoriel. Ce sous-espace est dit rul. 


EXEMPLE 4. L'ensemble de tous les vecteurs de l’espace “est un sous- 
espace, c’est-à-dire que tout l’espace est à la fois son sous-espace. 

Nous laissons au lecteur le soin de vérifier les énoncés des deux derniers 
exemples. 


PROPOSITION 2. Soit /” un sous-espace de l’espace vectoriel / de 
dimension n. La dimension de _/" est alors k < n. Sik = n, /" coïncide 
avec _”,. 


Admettons que _/ ” est un sous-espace non nul, car c’est le seul cas qui 
exige une démonstration. Il existe alors dans / ” un vecteur non nul à par- 
tir duquel on peut construire une base dans /”, comme on l’a fait dans la 
démonstration de la proposition 9 du $ 1. La construction doit s’achever 
au n-ième vecteur, vu que tout système libre dans /" est aussi libre dans 
et par suite, ne peut contenir plus de 7 vecteurs. 

Si la base dans _/" contient n vecteurs, tout vecteur de _Z se développe 
suivant ces vecteurs et appartient donc à -“". On voit donc que le sous- 
espace coïncide avec /. 

Etant donné que _ ‘ est l’enveloppe linéaire de sa base, il ressort de la 
proposition 2 que tout sous-espace d’un espace de dimension finie est une 
enveloppe linéaire d’un ensemble fini de vecteurs. Ceci se rapporte aussi au 
sous-espace nul car il est l’enveloppe linéaire du vecteur nul. 


PROPOSITION 3. Soit _/° un sous-espace de l'espace vectoriel 
n-dimensionnel _/ et soit le,, …, e,, e,,,, .…, e,N une base dans /, qui 
complète la base Île,, …, e,| dans / ‘. Tous les vecteurs de /” sont alors 
les seuls vecteurs qui dans la base lle,, .…, e,| possèdent les composantes 
El = 0, 20 0. 


En effet, soit un vecteur x tel que £* +! = 0, .., £7 = 0. Il en ressort 
que x = le, + … + Eke, et, par suite, x appartient à / ’. Inversement, 
tout vecteur x de /” se développe en une combinaison linéaire x = 
= £le, + .…. + £fe, que l’on peut traiter comme un développement de x 
suivant les vecteurs e,, …, e, si l’on pose £*+1 = O0, ..,£" = O. 

Remarquons que les égalités £*+! = 0, ...,£" = 0 peuvent être consi- 
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dérées comme un système d’équations linéaires reliant les coordonnées du 
vecteur x. Le rang de ce système est n — Æ et ses solutions représentent les 
colonnes de coordonnées des vecteurs de “". On démontre aisément que 
"se définit dans toute base par un système d’équations homogènes de 
rang 7 — k. En effet, dans tout changement de base, les anciennes compo- 
santes du vecteur s’expriment au moyen des nouvelles par les formules (4) 
du $ 1, et dans la nouvelle base le système d’équations prend la forme 


Vin lEtlimQux, V'o7Et =0: 


im] is] 


Le rang de ce système est toujours 7 — K, vu que les lignes de la matrice de 
passage sont linéairement indépendantes. Ainsi, on a démontré la 


PROPOSITION 4. Etant donné une base dans l’espace _“ de dimension n, les 
colonnes de coordonnées des vecteurs du sous-espace _/" de dimension k 
vérifient le système d'équations linéaires homogènes de rang n — K*). 


2. Somme et intersection de sous-espaces. Considérons deux sous- 
espaces /” et / ‘” d’un espace vectoriel _/. 


DÉFINITION. On appelle somme des sous-espaces _/” et / "", et on note 
Z" + °°", l'enveloppe linéaire de leur réunion _/" U 7". 

D'une façon plus détaillée, la définition veut dire que tous les vecteurs x 
de /° + /°" (et eux seuls) peuvent être représentés sous forme de x = 
= D QP; + D B;q;, où les vecteurs p, appartiennent à /”, et les vecteurs 

j 


t 
q à / ‘‘. En désignant les sommes par x° et x°”, on constate que le sous- 
espace /° + / ‘" se compose des vecteurs de la forme x = x° + x”, où 
x” est un vecteur de /” et x’ un vecteur de “”". 

Supposons que les dimensions des sous-espaces " et /"” sont k et /. 
Choisissons une base le,, …, 1 dans /” et une base 1f,, .…, 1 dans /"". 
Chaque vecteur de /” + _/"" se décompose suivant les vecteurs e,, …,e,, 
J,, .., f,. On obtient une base dans /”" + _/"” en chassant de ce système 
de vecteurs tout vecteur qui s'exprime linéairement au moyen des autres. 
On le réalise ainsi. 

Choisissons une base quelconque dans l’espace _/ et considérons une 
matrice formée des colonnes de coordonnées de tous les vecteurs e,, ..., e,, 
J,, .…, J,. Les vecteurs dont les colonnes de coordonnées contiennent le 
mineur principal de cette matrice constituent la base dans “” + _/'". La 
démonstration n’étant pas difficile, on propose au lecteur de la faire à titre 
d'exercice. 


°)Si ”" = _/ le système est de rang 0, autrement dit ne contient aucune équation non 
triviale. 
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DÉFINITION On appelle intersection des sous-espaces /" et / ‘",et on 
note /° MN _/"”", l’ensemble des vecteurs communs aux deux sous-espaces. 

L intersection "MN 7" est un sous-espace. 

En effet, si les vecteurs x et y appartiennent à /" MN /””, ils appartien- 
nent à la fois à /” et à /‘". Il s'ensuit que les vecteurs x + y et æx, avec 
un æ quelconque, appartiennent de même à /° et à /‘”, donc à 
sn’. 

Si dans un espace _/ de dimension finie les sous-espaces _/” et /’" sont 
définis par des systèmes d’équations, leur intersection _/" MN /"" se défi- 
nit par le système qui est la réunion de toutes les équations des systèmes qui 
définissent / ” et /"". Le système fondamental de solutions de ce système 
d'équations est alors une base dans le sous-espace /" N /" 


THÉORÈMEI. La dimension de la somme de deux sous-espaces est égale à 
la somme de leurs dimensions moins la dimension de leur intersection. 


DÉMONSTRATION. Soient /” et /"” deux sous-espaces dans l’espace / 
de dimension finie. Considérons dans /” + _/"" le système de vecteurs 
défini de la façon suivante. Si l’intersection /" MN /”° est un espace non 
nul, choisissons une base Île,, ..., e,Ï dans /” N _/"" et complétons-la par 
les vecteurs f,, ..…, f, jusqu’à la base de /” et par les vecteurs g,, .…., g,, 
jusqu’à la base de /"". Si /" N /"" est un espace nul, prenons tout sim- 
plement la réunion d’une base de /” et d’une base de /”"". Démontrons 
préalablement que chaque vecteur x de /” + /”" est une combinaison 
linéaire des vecteurs choisis. En effet, x = x° + x°°, où x’ appartient à 
/",etx"" à", si bien que x’ se décompose suivant les vecteurs f,, .…, f,, 
e,, ..., e,, et X°° suivant les vecteurs e,, ..…, e,, 8,, ..…., £,,. 

Montrons maintenant que ce système de vecteurs est libre. Soit une 
combinaison linéaire de ces vecteurs, égale à zéro : 


I « m 
YO œf,+ Ÿ Be: + Ÿ v£& =0o. (1) 


i-i ji sul 


Le vecteur x = Zy’g, appartient à /"". Or, il est évident que x = 

= — Lœif, — Le; et, par suite, x appartient aussi à / ”. Ainsi, le vecteur 
x doit se trouver dans l'intersection /”" N /"’. D'où, en vertu de la pro- 
position 3, on peut conclure que œ! = ... = æ« = 0ety! =... = y" = 0. 
Il ne reste dans l’égalité (1) que les termes 


B'e, + .… + Be, 


si” N/"" + o. Mais leurs coefficients sont aussi nuls car les vecteurs 
€, -…, €, SOnt linéairement indépendants. Ainsi donc, la combinaison 
linéaire (1) est nécessairement triviale et tous les vecteurs sont linéairement 
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indépendants. On a montré que le système des vecteurs f,, …,f,,e,, ..….,e,, 
Br, 8, est une base dans le sous-espace /" + 7°". 

On peut maintenant achever sans difficulté la démonstration. La 
dimension de / ” est / + k, celle de /‘’, k + m, tandis que celle de la 
somme /" + °° est, comme on vient de montrer, # + / + m. 

Il découle en particulier du théorème 1 que deux sous-espaces d’un 
espace de dimension n ont toujours une intersection non nulle si la somme 
des dimensions de ces sous-espaces est strictement supérieure à 7. En effet, 
la dimension de leur somme ne peut dépasser n. 

3. Somme directe de sous-espaces. Si l’intersection des sous-espaces _/” 
et / ‘" est le sous-espace nul, leur somme /" + _/"" est appelée somme 
directe et est notée /° + / °°" ou /'° ® /'. 

La dimension de la somme directe est égale à la somme des dimensions 
des termes. Soient |f,, .…, fl une base dans /” et llg,, .…, g,Î une base 
dans /”". De la démonstration du théorème 1 il découle que le système des 
vecteurs f,, …, f;, 8, .…., 8, est une base dans LB". 


PROPOSITION 5. Tout vecteur x de la somme directe /° ® /‘" se 
décompose de façon unique en somme des vecteurs x e /‘etx' e /". 


En effet, s’il y avait deux décompositions différentes x = x° + x'°et 
x=y +}y"",onauraitx" — y = y’ — x'"°.1Ilest clair que le vecteur 
x — y'e/'.Orilest égal à y’ — x'° et, par suite, appartient à /”.. 
Donc, x -y'e N/",d'oùx" =y' etx' = y‘. 

Signalons en conclusion de ce paragraphe que les notions de somme et 
d’intersection de deux sous-espaces peuvent être facilement étendues à 
toute famille finie de sous-espaces. 

DÉFINITION. On dit que la somme des sous-espaces AN, L est 


S 
directe et on la note (1) @ …. ® / 9 ou Œ D si 


1-1 


MN ÿ /® = o pour tous les & = 1, ..,s. 
1 #k 
On voit immédiatement que dans ce cas 
0 ® … ® 70 = (4/0 @ …. ® 0-0) + 0, 

= 2, as: 
En se servant de cette formule et des propriétés de la somme directe de deux 
sous-espaces, on démontre aisément par récurrence que la réunion des 
bases des sous-espaces _/Ü est une base de leur somme directe. Il s'ensuit 


en particulier que la dimesion de la somme directe est égale à la somme des 
dimensions des termes. 
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Chaque vecteur de la somme des sous-espaces se décompose en une 
somme Lx, où x; e (0. Si la somme est directe, cette décomposition est 
unique. En effet, si un vecteur x admettait deux décompositions différentes 
x = x; = Ey,,on aurait £ (x, — y) = o. Or cette égalité entraîne immé- 
diatement que les vecteurs de la réunion des bases des sous-espaces 
sont linéairement dépendants. 

Laissons au lecteur le soin de vérifier que toutes les propriétés de la 
somme directe mentionnées ici sont équivalentes à la définition de la 
somme directe. 


$ 3. Applications linéaires 


1. Définition. Soient “et _/deux espaces vectoriels, tous deux réels ou 
complexes. On appelle application À de l’espace “dans l’espace une 
relation qui associe à chaque vecteur de “un vecteur de et un seul. On le 
note tout court À : / — _/ L'image du vecteur x est notée A(x). 


DÉFINITION. L’application À : /— _fest dite linéaire si pour tous vec- 
teurs x et y de “et tout nombre « sont vérifiées les égalités 


A(x + y) = A(x) + AU), A(ax) = aÂA(x). (1) 


Il faut souligner que le signr « + » dans les deux membres de Îa pre- 
mière formule de (1) désigne en général deux opérations différentes : 
l’addition dans l’espace / et l’addition dans l’espace _7 Une remarque 
analogue peut être faite à propos de la seconde formule. 

Il découle immédiatement de la définition que l’image par application 
linéaire d’une combinaison linéaire de vecteurs est la combinaison linéaire 
de leurs images. 

On dit que l’application linéaire est une transformation linéaire si les 
espaces _/ et / se confondent. 

Voici quelques exemples d’applications linéaires. 

1) Soit À un nombre fixé. Associons à chaque vecteur x de l’espace 
le vecteur Àx. Il est aisé de voir que c’est une transformation linéaire. 

2) Dans une transformation affine du plan, l’espace bidimensionnel des 
vecteurs de ce plan s’applique sur lui-même. Ceci étant, l’image de la 
somme de vecteurs est la somme de leurs images, tandis que l’image du pro- 
duit d’un vecteur par un nombre est le produit de l’image du vecteur par ce 
nombre. 

3) Choisissons une base dans un espace vectoriel réel # de dimension # 
et associons à chaque vecteur sa colonne de coordonnées. L’application 
ainsi définie est une application linéaire de l’espace considéré dans l’espace 
des matrices-colonnes à n éléments. 

Si l’on fait correspondre à chaque vecteur sa première composante, on 
obtient une application de l’espace _# dans l’espace vectoriel # des nom- 
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bres réels. Cette application est linéaire en vertu des propriétés des opéra- 
tions sur les composantes des vecteurs. Les applications linéaires de 
dans # s'appellent fonctions linéaires sur ,. On les étudiera plus loin 
dans le chapitre VIII. 

4) Soient C[— 1, 1] et C[0, 2] les espaces de fonctions continues res- 
pectivement sur les segments [ — 1, 1] et [0, 2]. Faisons correspondre à toute 
fonction f(x) de C°[—1, 1] la fonction f(x + 1) de C°[0, 2]. L'application 
ainsi définie est évidemment linéaire. Un exemple moins trivial peut être 
obtenu en faisant correspondre à chaque fonction de C°[- 1, 1] sa fonction 
primitive F(x) satisfaisant à la condition F(0) = 

5) Considérons l’espace arithmétique .#, de dimension nr (espace des 
matrices-colonnes à nr éléments) et une matrice À à m lignes et nr colonnes. 
Associons à chaque matrice-colonne £ de :#, une matrice-colonne AË qui 
CompEene m éléments. La relation ainsi définie est une application de .4, 
dans .#_. Cette application est linéaire en vertu des propriétés de la multi- 
plication des matrices. 

6) L’application qui fait correspondre à chaque vecteur le vecteur nul 
est linéaire. On l’appelle application nulle. 

Dans la suite de ce paragraphe, les lettres n et m désigneront les dimen- 
sions respectives des espaces _/ et _/. 

Démontrons la propriété générale suivante des applications linéaires. 


PRopPosiTion 1. Etant donné une PRES linéaire À : — 7 
l’image de tout sous-espace vectoriel /" de , est un Du espace Cet 
A(-/") de 4 dont la dimension ne dépasse pas celle de ” 


En effet, soit Île,, .…, e,Îl une base dans _/ ". Pour tout vecteur x de /” 
ona x = Ële, + …. + Eke, et, par suite, 


A(x) = A(Ele, + … + Ete,) = ElA(e,) + … + EKA(e,). (2) 


Cela signifie que tout élément de l’ensemble A(_-°) des images de tous les 
vecteurs de ”" est une combinaison linéaire des vecteurs A(e,), …, A(e,). 
Inversement, toute combinaison linéaire des vecteurs A(e,), ..…, A(e,) est 
évidemment l’image d’un vecteur de / ’. Ainsi, l’ensemble A(_/ ‘) se con- 
fond avec l’enveloppe linéaire des vecteurs A(e,), .…, A(e,) et partant, est 
un sous-espace. La dimension de ce sous-espace ne dépasse pas £ en vertu 
de la proposition 1 du $ 2. 

I! faut signaler un cas particulier de la proposition démontrée : l’ensem- 
ble des images de tous les vecteurs de , est un sous-espace dans _, 

On désignera ce sous-espace par A(7 ,) en l’appelant ensemble des 
valeurs de l’application. 


DÉFINITION. La dimension de l’ensemble des valeurs de l’application À 
est appelée rang de cette application. 
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Si le rang de À est égal à m, c’est-à-dire si A(_/,) coïncide avec PA , Cha- 
que vecteur de F est l’image d’un vecteur de f. On dit alors que A est 
une application surjecti ve, ou surjection. 


PROPOSITION 2. L'ensemble des vecteurs de _/, dont l’image par l'appli- 
cation À est le vecteur nul est un sous-espace vectoriel dans 7,. 


En effet, si deux vecteurs se transforment en vecteur nul, il en est de 
même de leur somme. Si A(x) = o, on a (ax) = ao = o. 


DÉFINITION. On appelle noyau de l’application À un sous-espace de vec- 
teurs dont l’image est le vecteur nul. 

Le noyau d’une application n’est jamais un ensemble vide car il con- 
tient au moins le vecteur nul. En effet, A(o) = A(0x) = OA(x) = o.Sila 
dimension du noyau est différente de zéro et le noyau contient au moins un 
vecteur non nul, il existe dans _,, des vecteurs qui admettent au moins deux 
antécédents (tel est le cas du vecteur nul de _/,). La réciproque est égale- 
ment vraie : s’il existe un vecteur * ayant deux antécédents différents, c’est- 
à-dire si A(x) = A(y) = à, le noyau de À contient un vecteur non nul. En 
effet, on a dans ce cas x — y # Oet A(x — y) = 

L’application dans laquelle les images des vecteurs distincts sont dis- 
tinctes est appelée application injective ou injection. On a donc la 


PROPOSITION 3. Une application est injective si et seulement si son noyau 
est le sous-espace nul. 


2. Expression analytique d’une application linéaire. Considérons deux 
espaces vectoriels /, et -, de dimensions # et m et une application 
A:/ — /. Soit le, … ss e, lune base dans l’espace 7. On peut alors 
représenter l’image d’un vecteur quelconque x = £le, + .. + £’e, sous la 
forme 

A(x) = t'A(e,) + … + £"A(e,). (3) 


Donc, A(x) peut être défini d’après les composantes de x si sont connus les 
n vecteurs A(e,), .…, A(e,) dans pe, 

Soit Hf,, …,f, 1 une base dans 7 espace JL . Décomposons chacun des 
vecteurs A(e.) suivant les vecteurs de cette base : 


A(e,) = y œf, (= 1,...,n). 
pe 
Si les composantes de A(x) par rapport à la base f sont notées 7!, … 
.…, 77, l’égalité (3) peut être écrite ainsi : 
D 9, = À Eœf, 
i, p 


pui 
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D'où, en vertu de l’unicité de la décomposition dans une base : 


> ae! (4) 
im 
pour tout p = I, 
Soit À une matrice à éléments a?. L'égalité (4) peut alors être écrite sous 
la forme matricielle : 


n = AË (5) 
ou de façon plus détaillée 
1! CR £! 
7" TO is. 507 En 


La colonne de coordonnées de l’image (dans la base f) est exprimée ici 
sous forme de produit de la matrice (7, n) par la colonne de coordonnées 
de l’antécédent (dans la base e). Il est utile de comparer ce résultat avec 
l'exemple 5) du point précédent. 


DériniTion. On appelle matrice de l'application linéaire À : # — À 
par rapport aux bases e et f, la matrice dont les colonnes (prises dans leur 
ordre naturel) représentent les colonnes de coordonnées des vecteurs 
A(e,), …, A(e,) dans la base f. 

La matrice À, construite plus haut avec les éléments @æ, est justement la 
matrice de l’application À par rapport aux bases choisies. 

La matrice de l’application linéaire est parfaitement définie au sens sui- 
vant : si pour tout vecteur x = ef la colonne de coordonnées de l’image 
A (x) dans la base f est » = BE, les colonnes de la matrice B sont des colon- 
nes de coordonnées des vecteurs A(e, ), de sorte que la matrice B coïncide 
avec la matrice À. 

Cette assertion est facile à vérifier. Mulitiplions la matrice B par la 
colonne de coordonnées du vecteur e,, c’est-à-dire par la i-ième colonne de 
la matrice unité d'ordre n. Il est évident que le produit est égal à la s-ième 
colonne de B qui est la colonne de coordonnées de A(e)). 

L'exemple 5) montre que, les bases e et f étant choisies, toute matrice de 
type (m, n) est la matrice d’une application linéaire #4 — . 

Ainsi donc, on voit que le choix de bases dans les espaces LS et L éta- 
blit une correspondance biunivoque entre les applications # — Ze et les 
matrices de type (mn, nñ). 


PROPOSITION 4. Le rang de la matrice d’une application linéaire est égal 
au rang de cette application. 
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DEMONSTRATION. Soient j,, …, j, les numéros des colonnes renfermant le 
mineur principal de la matrice À d’une application linéaire À. Cela signifie 
que les vecteurs A(e, ), , A(e, ) sont linéairement indépendants et que 
‘ chaque vecteur A(e)) ré = n 1") est leur combinaison linéaire. Par suite, 
on est en mesure d’ ne vi image de tout vecteur A(x) au moyen des 
seuls vecteurs A(e;), on A(e;). Donc, ces vecteurs constituent une base 
dans l’ensemble des valeurs de l’application À, et leur nombre est égal à la 
dimension de A(_/,), c’est-à-dire au rang de l’application. La proposition 
est démontrée. 

Il résulte de la proposition 4 que le rang de la matrice d’une application 
linéaire est le même, quel que soit le couple de bases choisi. 

Profitons de l’expression analytique d’une application linéaire pour 
démontrer la proposition suivante. 


PROPOSITIONS. La somme du rang de l'application À : /, — L et de la 
dimension de son noyau est égale à la dimension de l’espace Z. 


DÉMONSTRATION. Selon la formule (5), le noyau de l’application se défi- 
nit par le système d'équations linéaires homogènes AË = o à n inconnues. 
Comme il découle de la proposition 4, le rang de la matrice de ce système 
est égal au rang r de l’application. Soit d la dimension du noyau. La pro- 
priété de l’ensemble des solutions du système d’équations homogènes 
entraîne alors que d = n — r. La proposition est démontrée. 

En particulier, l'égalité r = n est nécessaire et suffisante pour que 
l'application ait un noyau nul, c’est-à-dire pour qu’elle soit une injection. 

Rappelons que l'application est dite bijective si tout vecteur x de 7, est 
l’image d’un vecteur x de _/ et d’un seul. Cela signifie qu’une application 
bijective est en même temps une injection et une surjection. Pour une injec- 
tiononar = net pour une surjection, 7 = m. Ainsi donc, on a la 


PROPOSITION 6. L'application À : /, — + est bijective si et seulement si 
les dimensions des espaces cotncident et sont égales au rang de l’applica- 
tion. 


Cette proposition résulte aussi facilement à partir de l’étude du système 
d’équations linéaires (4) : le fait que l’application est bijective signifie que 
ce système possède une solution unique £ pour toute matrice-colonne des 
termes constants 7. 

3. Isomorphisme d'espaces linéaires. DÉFINITION. On appelle isomor- 
phisme une application linéaire Pere d’un espace vectoriel sur l’autre. 
S’il existe un isomorphisme de _/sur _”, les espaces _/et _#sont dits isomor- 
phes. 

Il découle de la proposition 6 que, pour que deux espaces soient isomor- 
phes, il faut que leurs dimensions coïncident. Il s’avère que cette condition 
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est également suffisante, c’est-à-dire qu'’a lieu le théorème d’isomorphisme 
suivant. 


THÉORÈME 1. Deux espaces vectoriels réels (resp. complexes) sont iso- 
morphes si et seulement si leurs dimensions sont égales. 


Il nous reste à démontrer que la condition est suffisante. Soient _“et 2 
deux espaces vectoriels de dimension #. Si une base est choisie dans chacun_ 
d’eux, toute matrice carrée d’ordre n définit une application de / dans / 
par la formule (5). Cette application est un isomorphisme si le rang de la 
matrice est égal à n. Ainsi, pour définir un isomorphisme de sur ”, il suf- 
fit de choisir des bases dans ces espaces et de définir une matrice de rang n 
(c’est-à-dire de déterminant non nul). 

L'importance du théorème d’isomorphisme est la suivante. Lorsqu'on 
étudie les propriétés des espaces vectoriels qui sont liées aux opérations 
d’addition et de multiplication par un nombre, on ne s’intéresse pas à la 
nature de leurs éléments, que ce soient colonnes, polynômes, nombres, seg- 
ments orientés, fonctions ou matrices. Les propriétés de deux espaces iso- 
morphes sont absolument identiques. Au point de vue algébrique, les espa- 
ces isomorphes sont identiques. Si l’on convient de ne pas différencier les 
espaces isomorphes, le théorème d’isomorphisme nous permet d'associer à 
chaque dimension un seul espace vectoriel. 

4. Variation de la matrice d’une application linéaire avec le D 
de base. Considérons une application linéaire À : 7 — + Les espaces _” 
et PF étant rapportés aux bases respectives eet f, A: se définit par la matrice 
A. Soit un autre couple de bases e” et f” liées à e et f par des matrices de 
passage S et P, et soit 4° la matrice de l’application À par rapport aux 
bases e’ et f’. Il nous faut trouver une relation entre les matrices À et 4°. 

Considérons un vecteur x de l’espace _/ et son image y = A(x). Dési- 
gnons les colonnes de coordonnées de x dans les bases e et e” respective- 
ment par & et £’, et les colonnes de coordonnées du vecteur y dans les bases 
fetf' par net n . Selon la formule (3) du $ 1, on a les relations matricielles 
suivantes entre les anciennes et les nouvelles coordonnées des vecteurs x et 


y: 

£ = SE” , 7 — Pr . 
En portant ces expressions dans la formule (5), on obtient Pr = AS£’. 
Vu que la matrice de passage possède toujours son inverse, on peut définir 
n' à partir de cette égalité : 7° = P-!AS£".Or,n' = A°£° par définition 
de A’. La matrice de l’application linéaire étant parfaitement définie par 
rapport aux bases données, il vient 


A° = P7'AS. (6) 


C’est la relation cherchée entre les matrices À et 4°. 
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Si l’on désigne les éléments des matrices À et 4° par @ et &';, et les élé- 
ments de P-! et S respectivement par »! et dj l’égalité matricielle (6) peut 
être écrite sous forme de mn égalités numériques : 


Y p, æfo! (7) 
k. 


Les indices prennent ici les valeurs suivantes : à, £ = 1,...,m ;j,1l = 1, 
A. 

S. Forme canonique d’une matrice de l’application linéaire. Il découle 
de la formule (6) que la matrice de l’application linéaire A : 7 — _, varie 
avec le changement de bases dans _# et ,. Il se pose tout naturellement la 
question : comment choisir les bases dans _” et , pour que la matrice de 
l'application linéaire ait la plus simple forme. 


THÉORÈME2. Pour toute application linéaire À : 4, — L on peut choi- 
sir des bases e et f dans les espaces _”, et /,, de manière que la matrice de 
l'application soit de la forme*) 


a 549] e 


où E, est la matrice unité d'ordre r. 


DÉMONSTRATION. Soit r le rang de l’application A. Choisissons une base 
e dans l’espace _, de la façon suivante : soient e,,,, ..., e, ses ñn — r vec- 
teurs qui appartiennent au noyau de l’application À (sa dimension est juste- 
ment 7 — r), et soient e,, .., e, des vecteurs choisis arbitrairement. En 
vertu de ce choix, les 7 — r dernières colonnes de la matrice sont nulles 
quelle que soit la base f dans l’espace #,. Vu que le rang de la matrice est r, 
les 7 premières colonnes doivent être linéairement indépendantes. Cela 
signifie que les vecteurs A(e,), …, A(e) sont linéairement indépendants. 
Admettons qu’ils soient les r premiers vecteurs de base dans l’espace , 
J, = A(e,), ….,f, = A(e), les autres vecteurs f,,,, ..…, f,, pouvant être 
choisis arbitrairement. Avec ce choix de la base, les 7 premières colonnes de 
la matrice sont les r premières colonnes de la matrice unité d’ordre m. C’est 
justement la forme (8) de la matrice de l’application. 

6. Somme et produit de deux applications. Considérons deux applica- 
tions linéaires À : /— /et B : / — / On appelle somme des applica- 
tions À et B, et on note À + B, l’application C : / — / définie par l’éga- 
lité C(x) = A(x) + B(x). On vérifie aisément que C est_une application 
linéaire. En effet, si des bases sont choisies dans et _ les colonnes de 
coordonnées des vecteurs A(x) et B(x) s'expriment au moyen des matrices 


*) Sir = m (resp. r = n), la matrice (8) n’a pas de lignes (resp. colonnes) nulles. 
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des applications sous la forme AË£ et B£. Par suite, la colonne de coordon- 
nées de C(x) est de la forme A£ + B£ = (A + B)£. Donc, À + Best une 
application linéaire et sa matrice est égale à la somme des matrices des 
applications À et B. 

Le produit de l’application linéaire A:/— À par le nombre a se défi- 
nit comme application B : _” — Î qui fait correspondre à tout vecteur x le 
vecteur œÂA (x). Il n’est pas difficile de vérifier qu’elle est linéaire et possède 
la matrice «A si À est la matrice de A. : oo. 

Le résultat de deux applications successives À : /— /e B : / — / 
est appelé leur produit et est noté B c À (la première application est écrite à 
droite). Il va de soi que B c À est une application linéaire de dans 

Soient , et des espaces vectoriels, et e, f et g leurs bases respecti- 
ves. Désignons par À la matrice de l’application À par rapport aux bases e 
et f et par B la matrice de B par rapport aux bases f et g 


PROPOSITION 7. L'application B° À admet BA pour matrice par rapport 
aux bases e et g. 


Pour le démontrer, considérons la colonne des coordonnées £ du vec- 
teur arbitraire x de . Notons % et ÿ les colonnes de coordonnées respecti- 
ves des vecteurs A(x) et B(A(x)). Selon la formule (5), on a alors n = AE et 
ÿ = Bn = BA, ce qu'il fallait démontrer. 

Puisque le rang de l'application coïncide avec celui de sa matrice, on a, 
conformément à la proposition 5 du $ 6, ch. V sur le rang du produit des 
matrices, la proposition suivante. 


PROPOSITION 8. Le rang du produit des applications ne dépasse pas ceux 
des facteurs. 


Le produit de l’application À par un nombre peut être assimilé au pro- 
duit de À par une transformation linéaire qui consiste en multiplication de 
tous les vecteurs par ce nombre (voir exemple 1), p. 182). 

Les propriétés de l’addition et de la multiplication des applications 
découlent immédiatement des propriétés correspondantes de la multiplica- 
tion des matrices et on ne s’y arrêtera pas. Laissons au lecteur le soin de 
formuler et de démontrer, par exemple, la propriété d’associativité de la 
multiplication des applications. 

Soit donnée une application linéaire À : 4 — . L'application 
linéaire B : ss — _/, est dite réciproque de À et notée A“ siBoA = Eet 
A°B = É, où 1 E et E sont des transformations identiques des espaces _ et 
À. Autrement dit, pour + x de # on doit avoir B(A(x)) = x, et 
A(B(>)) = }y pour tout y de 


PROPOSITION 9. L oplcetion linéaire À admet une réciproque si et seule- 
ment si À est un isomorphisme. 
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DÉMONSTRATION. Soit À un isomorphisme. Son rang satisfait alors à la 
condition r = m = net, par suite, on peut appliquer la règle de Cramer au 
système d'équations A£ = n liant les coordonnées de l’image à son antécé- 
dent dans un couple de bases. Ce système a une solution unique pour toute 
matrice-colonne de termes constants. Considérons une application B : 
/, — 7, qui à tout vecteur y avec colonne de coordonnées 7 associe le vec- 
teur x avec colonne de coordonnées £ égale à la solution A! de ce 
système. Vu que la matrice-colonne £ = À - !r est égale au produit de 7 par 
une matrice, l’application B est linéaire. Il va de soi qu’on a toujours 
B(A(x)) = xet A(B(»)) = y. Donc, l’application B est la réciproque de A. 

Supposons maintenant que À n’est pas un isomorphisme. On a alors 
soit r < m, soit r < n. Dans le premier cas, il existe dans #, un vecteur u 
qui n’appartient pas à A(_/,). Si l’application réciproque existait, on aurait 
u = A(A”'!(u))e A(_/), ce qui contredit le choix de u. Dans le second cas, 
il existe un vecteur z # o appartenant au noyau de À. Si l’application réci- 
proque existait, on obtiendrait l'égalité z = A-!(A(z)) = o contredisant le 
choix de z. La proposition est démontrée. 

En démontrant la première partie de la proposition on a obtenu la 
matrice de l’application A-!. Plus précisément, si la matrice de l’applica- 
tion À par rapport aux bases e et f est À, celle de l’application À-! par rap- 
port aux bases f et e est A”! 


$S 4. Problème des vecteurs propres 


1. Transformations linéaires. Au paragraphe précédent, on a défini la 
transformation linéaire comme une application linéaire de l’espace dans 
lui-même. Tous les résultats obtenus au $ 3 pour les applications sont aussi 
vrais pour les transformations, à condition qu’on fasse quelques remarques 
importantes concernant l'expression analytique de la transformation. 

A savoir, pour exprimer en coordonnées une application linéaire 
À : / — /, on choisit des bases dans les espaces et Æ Si les espaces 
coïncident, il est tout naturel d’utiliser une même base pour les images et 
leurs antécédents. Aussi a-t-on la 


DÉFINITION. On appelle matrice de la transformation linéaire À : /— / 
par rapport à la base e = Île,, .…, e,Î la matrice dont les colonnes sont des 
colonnes de coordonnées des vecteurs A(e,), …, A(e,) par rapport à la 
base e. 

En accord avec cette définition, la formule (6) du 3 pour la matrice 
d’une transformation prend la forme 


A' = S-!AS. (1) 
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L'ensemble des matrices À” déduites de la matrice donnée À suivant la 
formule (1) pour des S différentes est plus étroit que l’ensemble des matri- 
ces déduites de À suivant la formule (6) du $ 3 pour des matrices de passage 
S et P non liées entre elles. Il en découle certaines particularités de l’expres- 
sion analytique des transformations dont la principale est la suivante : un 
ensemble plus étroit peut ne pas contenir de matrice de forme canonique 
(8), $ 3, et le théorème 2 du $ 3 ne se vérifie pas pour les transformations. 

Il ne faut pas croire que c’est une conséquence accidentelle due à la défi- 
nition « malchanceuse » de la matrice d’une transformation. En effet, la 
matrice d’une application définit cette application et, par suite, toutes les 
propriétés de l’application se retrouvent parmi celles de sa matrice. Les 
propriétés de l’application sont celles des propriétés de la: matrice qui 
demeurent invariantes, c’est-à-dire qui ne varient pas lorsqu’on passe à un 
autre couple de bases. Les autres propriétés de la matrice dépendent non 
seulement de l’application considérée mais aussi du couple de bases choi- 
sies. Le theorème 2 du $ 3 signifie en effet que pour les espaces /et ”, 
donnés, l’unique propriété invariante de l’application est son rang, vu que 
toutes les applications d’un même rang se déterminent par la même matrice 
dans le couple de bases convenablement choisies. 

Les transformations linéaires présentent plus de propriétés invariantes 
que les applications linéaires, ce qui est dü au fait que l’image et son antécé- 
dent appartiennent à un même espace. Il devient possible de parler de la 
position d’une image par rapport à son antécédent, par exemple de discuter 
leur colinéarité, question qui n’a aucun sens pour une application de 
l’espace _/ dans un espace _” différent de _”. 

On étudiera exclusivement dans ce paragraphe les transformations 
linéaires et leurs propriétés que les applications linéaires ne possèdent pas 
en général. 

2. Sous-espaces invariants. Soit un espace vectoriel _/ et une transfor- 
mation linéaire À de cet espace. 


DÉFINITION. Le sous-espace _/ ” de l’espace _/ est dit énvariant par À si 
l’image A(x) de tout vecteur x de _ ‘ est encore dans _”/‘. 

On peut formuler cette définition différemment, en disant que / ” est 
invariant si A(_/‘) est un sous-espace dans _/‘. 


EXEMPLE 1. Considérons l’espace géométrique ordinaire des points et 
une rotation À de cet espace autour d’un axe donné p de l’angie æ. Un vec- 
teur se transforme par rotation en vecteur et, partant, la rotation À engen- 
dre une transformation dans l’espace tridimensionnel des vecteurs. Cette 
transformation est évidemment linéaire. Les vecteurs x portés par l’axe p 
engendrent un sous-espace invariant car A(x) = x. Les vecteurs perpendi- 
culaires à l’axe p constituent un sous-espace invariant bidimensionnel vu 
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que l’image par rotation de tout vecteur perpendiculaire à l’axe p est encore 
perpendiculaire à cet axe. 


EXEMPLE 2. Le sous-espace nul se transforme toujours en lui-même et, 
par suite, est invariant par toute transformation. 


EXEMPLE 3. L'espace “considéré comme son sous-espace est un sous- 
espace invariant. 


ExEMPLE 4. Tout sous-espace est invariant par les transformations iden- 
tique et nulle. 


EXEMPLES. Le noyau d’une transformation et l’ensemble de ses valeurs 
sont des sous-espaces invariants. 

Soit À une transformation linéaire dans l’espace vectoriel “de dimen- 
sion ñn et soit /”" un sous-espace de dimension k invariant par À. Choisis- 
sons dans “une base lle,, .…., e Ï telle que les vecteurs e,, …, e, soient dans 
7". La matrice À de la transformation À peut être divisée en quatre blocs : 


Les blocs 4,, 4,, 4, et À, sont respectivement des matrices de types (K, &), 
(K,n — K),(n — k,k)et (n — k,n — Kk). Démontrons que la matrice À, 
est nulle, autrement dit que les éléments a’ de la matrice À sont nuls pour 
les valeurs des indices / = 1, ...,£eti = k + 1,...,n. En effet, les k pre- 
mières colonnes de la matrice À sont des colonnes de coordonnées des vec- 
teurs A(e,), …, A(e,). Vu que _/” est un sous-espace invariant, ces vecteurs 
se trouvent dans _/”, de sorte que leurs composantes œ par rapport aux 
vecteurs de base e, ,,, ..., e, sont nulles d’après le proposition 3 du $ 2. 
Inversement, il est aisé de voir que s’il existe une base par rapport à 
laquelle la matrice de la transformation linéaire À prend la forme 


[£14 Fr @) 


l’enveloppe linéaire des vecteurs e,, .…, e, est un sous-espace invariant. En 
effet, 1l résulte de (2) que pour tous ;/ = 1, …, K 


k 
AG) = » 
is] 


et, par suite, l’image de la combinaison linéaire des vecteurs e,, .…., e, est 
une combinaison linéaire des mêmes vecteurs. Résumons ce qui vient d’être 
dit. 


PROPOSITION]. La matrice À de la transformation À est de la forme (2) si 


$ 4] PROBLÈME DES VECTEURS PROPRES 193 


et seulement si l'enveloppe linéaire des vecteurs e,, …., e, est un sous-espace 
invariant. 


La transformation À fait correspondre à chaque vecteur du sous-espace 
invariant /” un vecteur de ”", ce qui définit une transformation de 
l’espace /” qu’on appellera restriction de la transformation À au sous- 
espace /” et qu’on notera À‘. Pour les vecteurs de _/” on a ÀA’(x) = A(x), 
tandis que pour les vecteurs n’appartenant pas à ” la transformation A° 
n’est pas définie. La transformation À’ ne diffère de À que par l’ensemble 
des vecteurs pour lesquels elle est définie. 

La restriction de la transformation linéaire est assurément une transfor- 
mation linéaire. 

Conservons les notations utilisées pour la démonstration de la proposi- 
tion précédente. Il n’est pas difficile de démontrer que dans la base le,, … 
……, 1 de l’espace _/”" le bloc À, de la matrice (2) est la matrice de la trans- 
formation A‘. 

3. Vecteurs propres. Considérons un sous-espace unidimensionnel 
de l’espace vectoriel / La base dans 4 comprend un seul vecteur x non 
nul, de sorte que tout vecteur y de _4 est de la forme ax, où « est un nom- 
bre convenablement choisi. Si est invariant par la transformation 
linéaire À définie sur _/ on a A(x) e 4. Il existe donc un nombre À tel que 


A(x) = Àx. (3) 


Inversement, si la condition (3) est satisfaite pour un vecteur non nul de 
/, elle l’est également pour tout vecteur de 4 (on le vérifie aisément en 
multipliant les deux membres de l’égalité (3) par un nombre arbitraire). Par 
suite, / est un sous-espace invariant. 


DÉFINITION. On appelle vecteur propre de la transformation À un vec- 
teur non nul x satisfaisant à la condition (3). Le nombre À de l’égalité (3) est 
appelé valeur propre. On dit que le vecteur propre x est associé à la valeur 
propre À. 

On a vu que chaque sous-espace invariant unidimensionnel se définit 
par un vecteur propre et, inversement, chaque vecteur propre définit un 
sous-espace invariant unidimensionnel. 

Proposons-nous de trouver tous les vecteurs propres de la transforma- 
tion linéaire donnée A. Ce problème est d’une grande importance aussi 
bien pour les espaces de dimension finie que pour les espaces de dimension 
infinie. On l’étudiera pour les espaces de dimension finie n. 

L’espace _/étant rapporté à une base, l’égalité (3) s’écrit sous la forme 
de la relation A£ = XÀ£ qui relie la matrice À de la transformation À et la 
colonne de coordonnées £ du vecteur x. En notant E la matrice unité 
d’ordre 7, on peut mettre cette relation sous la forme 


13— 6442 (4 — ÀE)£ = 0 (4) 
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ou de façon détaillée | 
(ol — À)ET + al£? + … + al£t = 0, 
QE! + (oi — A)E? + … + œE = 0, (5) 


ME + oME? + … + (of — À)ET = 0. 


Traitons les égalités (5) comme un système d’équations permettant de trou- 
ver les composantes £!, ..., £”* du vecteur propre x. C’est un système de n 
équations linéaires homogènes à 7 inconnues. Le vecteur x devant être dif- 
férent de zéro, on ne s’intéressera qu’aux solutions non triviales, autrement 
dit aux solutions dont l’une au moins des composantes £' est non nulle. Le 
système admet une solution non triviale si son rang est strictement inférieur 
au nombre d’inconnues. Dans le cas considéré cela signifie que le détermi- 
nant de la matrice du système doit être nul : 


det (A. = XL) = lisses = (0. (6) 


L'égalité (6) est dénommée équation caractéristique. C’est la condition 
imposée au paramètre À, à laquelle doivent satisfaire toutes les valeurs pro- 
pres de la transformation À. Il va de soi que dans un espace réel aucune 
racine complexe de l’équation caractéristique n’est valeur propre, car l’éga- 
lité (3) perd alors son sens. 

La dernière remarque étant prise en compte, la condition obtenue est 
aussi suffisante. En effet, le rang du système (5) diminue pour chaque 
valeur de À satisfaisant à la condition (6), et ce système possède une solu- 
tion non triviale. Cette solution est la colonne de coordonnées du vecteur 
propre x correspondant à un À donné. On aboutit ainsi au théorème sui- 
vant. 


THÉORÈME 1. Dans un espace complexe, les seules racines de l'équation 
caractéristique sont des valeurs propres de la transformation. Il en est de 
même dans un espace réel pour les racines réelles de l'équation caractéristi- 
que. 


Le premier membre de l’équation caractéristique est un polynôme de 
degré n. En effet, selon la formule (6) du $ 2, ch. V, le déterminant est égal 
à la somme algébrique de produits dont chacun renferme n éléments de la 
matrice. Les seuls éléments qui contiennent À sont ceux de la diagonale 
principale. Il existe donc le produit 


(@} — A)(aZ — À). (a — À) (1) 


dont chaque facteur renferme À. Tout autre produit qui contient oi (i # J) 
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ne peut contenir les facteurs (ai — À) et (œ, — X), de sorte que chaque 
terme de la somme, sauf (7), contient une puissance de À dont l’exposant 
est au plus égal à n — 2. Chassons les parenthèses dans (7) et écrivons deux 
termes de plus haut degré en À : (—1)'A7 + (—1ÿ- (œil + …. + af)A77 1. 
Ces termes sont aussi dominants dans tout le polynôme. Le terme constant 
du polynôme est égal à sa valeur pour À = 0, soit à det(4 — 0ÆE) = det À. 
Ainsi donc, le premier membre de l’égalité (6) est le polynôme de la forme 


(— 17 + (— 1} AT D œi + … + det 4. 


i= 1 


Ce polynôme est appelé polynôme caractéristique de la matrice À. Il n’est 
pas difficile d’expliciter les autres coefficients, mais on n’en a pas besoin. 
Comme on le sait, un polynôme de degré n ne peut avoir plus de ñn racines 
différentes et possède toujours au moins une racine complexe. Si l’on con- 
sidère un espace réel, il peut arriver (pour un ñ# pair) que l’équation caracté- 
ristique ne possède aucune racine réelle et, par suite, la transformation 
linéaire n’a ni valeurs propres ni vecteurs propres. À titre d'exemple, on 
peut citer la rotation du plan. 

Dans un espace complexe, toute transformation linéaire présente au 
moins une valeur propre et, partant, au moins un vecteur propre. 

4. Propriétés des vecteurs propres et des valeurs propres. 


PROPOSITION 2. Tous les vecteurs propres associés à une même valeur 
propre constituent avec le vecteur nul un sous-espace vectoriel. 


L’assertion découle immédiatement du fait que les colonnes de coor- 
données de ces vecteurs constituent l’ensemble de toutes les solutions du 
système d’équations linéaires homogènes. 


THÉORÈME 2. Les vecteurs propres X,, …, x, Sont linéairement indépen- 
dants s'ils sont associés à des valeurs propres deux à deux différentes. 


Démontrons ce théorème par récurrence. Vérifions l’assertion pour 
deux vecteurs propres x, et x, associés à des valeurs propres différentes À, et 
À. Supposons qu’ils sont linéairement dépendants. Les vecteurs x, et x, 
étant non nuls, il existe un nombre a tel que x, = ax,. En appliquant la 
transformation À, on obtient A(x,) = À,x, et 


A(X,) = aÂ(x,) = ax, = Xi. 


Cela signifie que À,x, = Àx,, ce qui est impossible pour À, # X,. Ainsi 
donc, les vecteurs x, et x, sont linéairement indépendants. 

Admettons maintenant que tout système de £ — 1 vecteurs propres 
associés à des valeurs propres différentes est libre et démontrons-le pour un 
système de k vecteurs. 
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Supposons que le système des vecteurs x,, …, x, satisfait à la condition 
du théorème. Considérons leur combinaison linéaire égale à zéro 


QX, +. + a,X, = O. (8) 


Son image par la transformation A et son produit par À, sont respective- 
ment 
AIX, + .… + œAxX, = 0 
et 
O. 


AIX, +. + aAX, 
En retranchant ces égalités membre à membre, on obtient 


Par hypothèse de récurrence, cette combinaison linéaire est triviale et par 
suite 


M — À) =0,..,a A —-À)= 0. 


Puisque les valeurs propres sont deux à deux différentes, on a x, = … 
… = @,_, = 0, si bien que l’égalité (8) entraîne &, = 0. Ainsi donc, la 
combinaison linéaire (8) est triviale. Le théorème est démontré. 


PRoPOSITION3. Si À et À ‘ sont deux matrices de la transformation À’ par 
rapport aux bases distinctes, les polynômes caractéristiques de ces matrices 
colncident. 


En effet, selon la formule 4° = S-!ASona 
det (4 ‘ — ÀE) = det(S-!A4S — ÀE) = det S-!(4 — XE)S = 
=" det(A — ÀE) det Sdet S-! = det(A — XE). 


Il découle de cette proposition qu’on peut appeler polynôme caractéris- 
tique de la transformation À le polynôme caractéristique de la matrice À. 

Les coefficients du polynôme caractéristique sont des invariants liés à la 
transformation. En particulier, le déterminant de la matrice d’une trans- 
formation est indépendant du choix de la base. Un autre invariant impor- 
tant est le coefficient de (— À)" ! appelé rrace de la matrice : | + cé Es 
… + æ. 

Considérons maintenant un polynôme quelconque P(X) = y,À7 + … 
… + Yi} + Yo: Si À, st la racine de ce polynôme, P(X) est divisible par le 
binôme À — \,, c’est-à-dire est égal au produit de À — À, par le polynôme 
P, (À). Il peut arriver que P(X) est divisible non seulement par À — À, mais 
aussi par (À — À} pour un entier s > 1, autrement dit, P(A) est de la 
forme (À — XP, (À), où P, est un polynôme. Le plus grand nombre s 
muni de cette propriété est appelé multiplicité de la racine N,. Les racines de 
multiplicité 1 sont dites simples. 
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THÉORÈME3. Si la valeur propre \, de la transformation À est une racine 
de l’équation caractéristique de multiplicité s, on peut lui associer au plus s 
vecteurs propres linéairement indépendants. 


DÉMONSTRATION. Supposons qu’il existe £ vecteurs propres linéairement 
indépendants associés à À,. Notons-les e,, …, e, et complétons-les par les 
vecteurs e, ,,, ..., €, jusqu’à la base de l’espace . Rapportée à cette base, 
la matrice À de la transformation À est de la forme 


À 0 


A = . |B||, 
0 à 


em 


O 


où B est une matrice à n lignes et ñ — k colonnes. En effet, pour chaque 
i < k la i-ième colonne est la colonne de coordonnées du vecteur A(e,) = 
= Ne, dont tous les éléments sont des zéros sauf le i-ième élément égal à 
À. Considérons la matrice À — ÀE et développons son déterminant sui- 
vant chacune des 4 premières colonnes. Il vient det (4 — ÀE) = (à, — 
— À P(N. D’après la définition de la multiplicité on voit maintenant que 
K<Ss. 

Le lecteur peut vérifier à titre d’exercice que la transformation linéaire 


de l’espace bidimensionnel, définie par la matrice k A possède une 


valeur propre de multiplicité 2 et un seul vecteur propre indépendant. 


PROPOSITION 4. La transformation linéaire admet une valeur propre égale 
à zéro si et seulement si elle n’est pas bijective. 


En effet, d’après la proposition 6 du $ 3, la transformation est bijective 
si et seulement si son rang est n, autrement dit si le déterminant de sa 
matrice est différent de zéro. Or le déterminant est égal au terme constant 
du polynôme caractéristique, de sorte que le déterminant est nul si et seule- 
ment si le zéro est la racine de l’équation caractéristique. 

Signalons que pour un vecteur propre associé à la valeur propre nulle, 
on a A(x) = o. Cela signifie que le noyau de À renferme le vecteur non 
nul x. 

PROPOSITION 5. Soit À une transformation linéaire de l'espace vectoriel réel. À toute racine 


complexe du polynôme caractéristique de la transformation À correspond un sous-espace 
invariant bidimensionnel. 


Si le nombre a + iB vérifie l'équation det (4 — ÀE) = 0, le système d'équations linéaires 
[A — (œ + iB)E}£ = o possède une solution non triviale. Cette solution est une matrice- 
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colonne complexe à n éléments que l’on peut écrire sous la forme » + if, où » et £ sont des 
matrices-colonnes réelles. L'égalité de deux matrices-colonnes complexes AE = À£ est équiva- 
lente à deux égalités entre les matrices-colonnes réelles, à savoir : 


An = om — BY, AT = Bn + af. (10) 


Les matrices-colonnes # et £ sont réelles et on peut leur faire correspondre des vecteurs qu'on 
notera y et z. Les égalités (10) signifient que A(y) = ay — Bz et A(z) = By + az. Ilen 
découle que l'enveloppe linéaire des vecteurs y et z est un sous-espace invariant. En effet, 


A(y + v2) = uA(ÿy) + vÂ(z) = (ua + vB)y + (va — uB)z. (11) 


Il reste à démontrer que les vecteurs y et z sont linéairement indépendants. Supposons le 
contraire : il existe alors des nombres y et » (u? + »? # 0) tels que (y + vz) = o, d'où en 
vertu de (11), (ua + vB)y + (vœ — uB)z = o. Posons pour fixer les idées que y # o. Multi- 
plions les deux égalites précédentes respectivement par va — {f et par » et retranchons l’une 
de l’autre. 11 vient, 

[vGua + vB) — u(va — uB))}y = o, 
d'où (r° + u°)8 = 0, c'est-à-dire B = 0, ce qui contredit l’hypothèse que æ + i8 est une 
racine complexe. 

Remarque. Si « + if vérifie l’équation algébrique à coefficients réels, il en est de 
même, comme on le sait, de son conjugué complexe « — i8. Dans le cas considéré, à deux 
racines conjuguées complexes correspond un même sous-espace invariant. Laissons au lecteur 
le soin de le démontrer. 


S. Diagonalisation de la matrice d’une transformation. On dira que la 
matrice carrée À d’éléments œi est de forme diagonale ou est diagonale si 
œi = 0 pour i # j, autrement dit si ne sont différents de zéro que les élé- 
ments a! situés sur la diagonale principale. 


ProPosiTioN 6. La matrice de la transformation linéaire À par rapport à 
la base le,, …, e, ll est de forme diagonale si et seulement si tous les vecteurs 
de base sont des vecteurs propres de la transformation. 


En effet, si le vecteur e. est un vecteur propre, on a Â(e) = Xe. et, par 
suite, le i-iéme élément de la colonne de coordonnées du vecteur A(e,) est 
X., les autres étant nuls. Il ne reste qu’à se rappeler que la i-ième colonne de 
la matrice de A est la colonne de coordonnées de A(e)). 

L’assertion inverse se démontre de façon analogue. 

Il découle du théorème 2 une condition suffisante, simple mais impor- 
tante, pour qu’il existe une base formée des vecteurs propres de la transfor- 
mation. 


PROPOSITION 7. Si une transformation possède n valeurs propres deux à 
deux différentes, il existe une base formée des vecteurs propres de cette 
transformation. 


Si le polynôme caractéristique d’une transformation admet des racines 
multiples, il est possible que sa matrice ne possède de forme diagonale en 
aucune base. L'exemple d’une telle transformation démunie de base de vec- 
teurs propres a été fourni p. 197. 


$ 4] PROBLÈME DES VECTEURS PROPRES 199 


Toutefois, il peut arriver qu’une transformation linéaire possède moins 
de n valeurs propres tout en ayant une base formée de ses vecteurs propres. 
En effet, on peut fixer une base et considérer une transformation définie 
par une matrice diagonale quelconque à éléments égaux sur la diagonale 
principale. Pour les transformations nulle et identique tout vecteur non nul 
est un vecteur propre, et dans toute base leurs matrices sont diagonales. 

La proposition 7 peut prendre la forme suivante. 


ProPosiTioN 8. Si toutes les racines du polynôme caractéristique de la 
matrice À sont différentes, il existe une matrice S de déterminant non nul, 
telle que la matrice S”' AS est diagonale. Si la matrice À est réelle et l’on 
veut que S le soit aussi, il faut que les racines du polynôme caractéristique 
soient réelles. 


CHAPITRE VII 


ESPACES EUCLIDIENS ET UNITAIRES 


$ 1. Espaces euclidiens 


1. Produit scalaire. L’espace vectoriel introduit dans le chapitre précé- 
dent diffère essentiellement de l’ensemble des vecteurs de l’espace géomé- 
trique ordinaire par le fait que dans l’espace vectoriel on n’a pas défini les 
notions de longueur et d’angle des vecteurs. On produira ces définitions 
dans le présent chapitre. 

Si dans le premier chapitre on a défini le produit scalaire à partir des 
notions de longueur et d’angle, ici il vaut mieux de procéder de façon 
inverse. On définira axiomatiquement l’opération de multiplication sca- 
laire, ensuite, en s’appuyant sur le produit scalaire, on introduira les 
notions de longueur et d’angle des vecteurs. 

Les résultats obtenus jusque-là concernaïient aussi bien les espaces réels 
que complexes. La multiplication scalaire se definit dans ces deux cas de 
façon différente. Le présent paragraphe est consacré aux espaces réels. 


DÉFINITION. On appelle espace euclidien un espace vectoriel réel muni de 
l’opération de multiplication scalaire qui à tout couple de vecteurs x et y 
associe un nombre réel (noté (x, y)), tout en vérifiant les conditions suivan- 
tes, quels que soient les vecteurs x, y et z et le nombre a : 


1° (x, y) = ©, x); 

2° (x + y,z) = (x,2) + (,2); 
3° (ax, y) = a(x, y); 

4 (x,y) > 0,5six # o. 


Indiquons les corollaires simples des axiomes 1° à 4° : 
1. (x, œy) = (œy,x) = aæ(y, x) et, par suite, on a toujours 


(x, ay) = a(x, y). (1) 
2. De façon analogue on démontre l'identité 
(x, y + z) = (x, y) + (x, 2). (2) 


3. En appliquant successivement les axiomes 2° et 3° et les deux corollai- 
res précédents, on démontre aisément que pour tous vecteurs et nombres, 
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(> ax) y a;(x;, y), 


is) CR 


(: ) Buy) 


K=]! 


(3) 


p 
) B,(x, Ye). 
k= 


4. Quel que soit le vecteur x, on a 
(x, 0) = 0. (4) 
En effet, posons o = 0x. Alors (x, o) = O(x, x) = 0. 


EXEMPLE 1. Pour les vecteurs (segments orientés) on a défini le produit 
scalaire comme produit de leurs longueurs par le cosinus de l’angle qu'ils 
forment. Le produit scalaire ainsi défini possède les propriétés 1° à 4° et 
dépend du choix de l’unité de longueur. Par conséquent, si l’unité de lon- 
gueur est choisie, les vecteurs de l’espace géométrique ordinaire forment 
par définition un espace euclidien tridimensionnel. 


EXEMPLE 2. Dans l’espace vectoriel des matrices-colonnes à nr éléments 
on peut introduire le produit scalaire en faisant correspondre à tout couple 
de matrices-colonnes £ et # le nombre 


En! + En? +. + Em, (5) 


où £' et n’ sont les éléments des matrices-colonnes. 

Le nombre (5) est le produit matriciel de la matrice-ligne € par la 
matrice-colonne #. Le lecteur s’assurera aisément que les axiomes 1° à 4° 
sont vérifiés. Muni du produit scalaire ainsi défini, l’espace des matrices- 
colonnes à 7 éléments devient un espace euclidien de dimension n. 


EXEMPLE 3. Dans l’espace des fonctions continues sur le segment {[0, 1] 
on peut introduire le produit scalaire suivant la formule 


Y,8) = [SE)z EE. 


0 


Les axiomes 1° à 4° découlent des propriétés bien connues de l’intégrale 
définie. 

2. Longueur et angle. Dans le chapitre I, on a obtenu les formules expri- 
mant la longueur du vecteur et l’angle des vecteurs au moyen du produit: 
scalaire. Conformément à ces formules introduisons la 


DÉFINITION. On appelle /ongueur du vecteur x et on la note lxi le nom- 
bre V(x, x). On appelle angle des vecteurs x et y tout nombre # satisfaisant 
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à la condition 


Gp). (6) 


En vertu de l’axiome 4°, la longueur du vecteur est un nombre réel posi- 
tif (ia racine est prise dans son sens arithmétique). La longueur du vecteur 
est nulle si et seulement si ce vecteur est nul. 

Quant à la définition de l’angle des vecteurs, la situation se complique. 
En effet, il nous faut démontrer que la valeur absolue du second membre 
de l’égalité (6) est au plus égale à l’unité. Or ce fait résulte de l’inégalité 


(x,»}° < (x,x)0,7) (7) 


liée aux noms de Schwarz, Cauchy et Bouniakovski. Démontrons cette iné- 
galité. 

Soient x et y des vecteurs quelconques de l’espace euclidien. Pour tous & 
et 6 on a la relation 


(ax + By, ax + By) = a°(x,x) + 2aB(x, y) + B?(y,y) > 0, (8) 


cette relation devenant nulle si et seulement si œx + By = o. En posant ici 
aœ = (y,y)et B = —(x, y), on obtient 


O, IX, x)O, y) — (x, y}°] > 0, 


d’où il découle l’inégalité cherchée si y # o. Dans le cas de y = 0, la rela- 
tion (7) est évidente. 

L'égalité a lieu dans la formule (7) si et seulement si x et y sont linéaire- 
ment dépendants. En effet, s’ils sont indépendants, on a l’inégalité stricte 
dans (8) pour a? + 8? # 0. Donc, l'inégalité stricte est aussi vérifiée dans 
(7). Inversement, soit une combinaison linéaire non triviale œx + By = 0. 
En la multipliant scalairement par x puis par y, on obtient les égalités 


ax, x) + BQ,x) = 0 et  a(x, y) + BCy,y) = 0. 


Le déterminant d’un système homogène ayant une solution non triviale est 
égal à zéro, d’où vient l’égalité cherchée. 


L'inégalité (7) entraîne encore unc inégalité simple et utile, à savoir 


Lx + pl < lxl + Lyl. (9) 


Elle découle de la suite de relations suivante: . 
x + y,x + y) = xl? + 2x, p) + lyl?< xl? + 21xllyt + Lyl? = (lxl + LylyÀ 


L'égalité s'établit si (x, y) = lxllyl, c'est-à-dire si et seulement si l'angle entre x et y est nul. 
L'inégalité (9) s'appelle inégalité triangulaire car, si les vecteurs sont des segments orientées, 
elle signifie qu'un côté du triangle est strictement inférieur à la somme de ses deux autres 
côtés. 
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On invite le lecteur d’écrire les inégalités (7) et (9) pour les espaces eucli- 
diens considérés dans les exemples 2 et 3. 

Les vecteurs x et y sont dits perpendiculaires ou orthogonaux si 
(x, y) = 0. Si au moins un des vecteurs x et y est nul, le second membre de 
(6) perd son sens. On admet par définition que le vecteur nul est orthogonal 
à tout vecteur. 


PROPOSITION]. Seul le vecteur nul est orthogonal à tout vecteur. 


En effet, soit (x, y) = 0 pour tout y. En posant y = x,ona(x,x) = 0, 
ce qui n’est possible que pour le vecteur nul. 

3. Base orthonormée. Le système des vecteurs f,, ..…, f,, d’un espace 
euclidien est dit orthonormé si (,,f;) = 0 pour i # jet (J,,f,) = 1, quels 
que soient { et /. 


PROPOSITION 2. Tout Système orthonormé de vecteurs est libre. 


DEMONSTRATION. Soit {f,, …, f,,} un système orthonormé de vecteurs. 
Considérons l'égalité œ,f, + … + a,f,, = 0. Il s'ensuit que &; = 0 pour 
tout i. En effet, multiplions scalairement par j les deux membres de l’éga- 
lité. Tous les termes, sauf le i-ième s’annulent et l’on obtient a;(f;, f:) = 
= a, = 0. Ainsi, toute combinaison linéaire des vecteurs f,, ., f,, égale à 
zéro est nécessairement triviale. La proposition est démontrée. 


THÉORÈME 1. Dans un espace euclidien de dimension n il existe un 
système orthonormé de n vecteurs. 


Signalons qu’en vertu de la proposition 2, ce système de vecteurs est une 
base. Une telle base est dite orthonormée. 

La démonstration sera faite par récurrence. 

1) Pour n = 1, l’assertion est évidente. Si f est un vecteur non nul, le 
vecteur e = |fl-!f forme un système orthonormé à un vecteur. 

2) Supposons que dans tout espace euclidien de dimension #7 — lil 
existe une base orthonormée et démontrons qu’il en est de même pour un 
espace euclidien quelconque <, de dimension n. Soit Îf,, .., f,1 une base 
quelconque dans é”,. L’enveloppe linéaire des vecteurs f,, .…., f,_, est un 
espace euclidien de dimension ñn — 1, de sorte que par hypothèse de récur- 
rence, il y existe un système orthonormé de ñ — 1 vecteurs e,, ..,e,_;. 
Considérons le vecteur g, = f, — æ,e, — .… — a,_,e,_,. Choisissons les 
coefficients æ,, …, æ, _, de manière que le vecteur g, soit orthogonal à tous 
les vecteurs e,, .…, e,_,. Etant donné que le système {e,, .…, e,_,] est 
orthonormé, on a (g,,e;) = (f,,e;) — a;, d’où a, = (f,,e;) pour tous les 
i = 1,...,n — 1. Considérons maintenant le vecteur e, = |g,l”'g,. Sa 
longueur est égale à l’unité et il est orthogonal aux vecteurs e,, ..,e,_,. 
On voit aussitôt que le système [e,, .…, e, | est orthonormé. 

La méthode utilisée pour la démonstration du théorème est appelée 
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méthode d’orthogonalisation. Pour s’en servir, on commence par normer 
le vecteur f,, c’est-à-dire qu’on construit le vecteur e, = 1f,17!f,. Ensuite 
on recherche la base orthonormée le,, e,l| dans l’enveloppe linéaire des 
vecteurs f,, f,. Cela se fait de la même façon que dans le point 2 de la 
démonstration. Après quoi, on construit de la même manière la base ortho- 
normée dans l’enveloppe linéaire des vecteurs j,, f,,/f,, etc. 

4. Expression du produit scalaire en fonction de composantes des fac- 
teurs. Soit l’espace euclidien #, rapporté à une base donnée le,, …, e,l. 


Tous vecteurs x et y se mettent alors sous la forme x = Y £'e; et y = 
Ûl 


= y 4 e;. Ici et plus loin, si le contraire n’est pas spécifié, l'indice de som- 
j 
mation prend les valeurs allant de l’unité à la dimension n# de l’espace. On a 


donc 
(x, y) = (E £'e,, Y me) 


En utilisant les formules (3), on peut écrire le produit scalaire sous la forme 


xy)= Y Eim/(e.e;). (10) 


di, j 


Si la base est orthonormée, on a (e;,e;) = 0 pour i # j, et la somme ne 
contient que les termes pour lesquels i = j. Puisque (e,, e;) = 1, dans une 
base orthonormée on a 


(x,y)= Y En. (11) 


Etant donné une base quelconque, considérons tous les produits scalai- 
res possibles (e,, e;) (i,j = 1, vs n) que l’on note habituellement get l’on 
écrit sous la forme d’une matrice carrée : 


AT 17 [(e,,e,) … (e,,;e,)| 
NEA) ee: _ D a : (12) 
prés I(e,,e,) … (e,,e,) 


La matrice (12) est appelée matrice de Gram de la base Île,, .…, e,ll. En 
vertu de la commutativité de la multiplication scalaire, on ag; = g;;et par 
suite, la matrice satisfait à la condition T = F, c’est-à-dire ne varie pas par 
transposition. Une telle matrice est dite symétrique. 

Désignons par £ etæ les colonnes de coordonnées des vecteurs x et y. On 
vérifie aisément en multipliant les matrices que l’égalité (10) peut être écrite 


$S 1] ESPACES EUCLIDIENS 205 


sous la forme matricielle suivante : 
(x, y) = Ty. (13) 


Une base est orthonormée si et seulement si sa matrice de Gram T est 
une matrice unité, de sorte qu’on a pour une base orthonormée 


(x,y) = &æ, (14) 
ce qui coïncide avec (11). 

5. Lien entre les matrices de Gram des bases différentes. Soient données 
deux bases le,, …,e,l et le,, …,e,l liées par la matrice de passage S sui- 
vant les formules e;/ = Ÿ o'e,, où par a sont désignés les éléments de S. 

k 
Pour des i et j quelconques on a maintenant en vertu de la formule (10) 


8j = 6 = (5 ce, Z dle)= E ctatur 
k l k, | 


L'égalité obtenue exprime un élément de la matrice de Gram l'° de la base 
e’ au moyen des éléments de la matrice de Gram de la base e. L’ensemble 
de ces égalites pour tous les ÿ et ; est équivalent à la relation matricielle 


T° ='Srs. (15) 


On le vérifie aisément en explicitant le second membre de (15). 

Considérons la formule (15) dans le cas particulier où la base e est 
orthonormée. Alors T = E et F°’ = 'SS. En calculant le déterminant des 
deux membres de l’égalité, on obtient det FF’ = det !S det S = (det S)2. Vu 
que la base e” est arbitraire, on a la 


PROPOSITION 3. Le déterminant de la matrice de Gram de toute base est 
strictement positif. 
Cette proposition peut être renforcée de la façon suivante. 


THÉORÈME 2. Soient x,, ..…, x, des vecteurs arbitraires (non nécessaire- 
ment linéairement indépendants) dans l’espace euclidien. Le déterminant 
de la matrice 

(x, x)... (x, xx) 


Ce, X) . (Xe, X) 


composée de leurs produits scalaires est strictement positif si les vecteurs 
sont linéairement indépendants, et égal à zéro s'ils sont linéairement dépen- 
dants. 

La première assertion du théorème se déduit immédiatement de la pro- 
position 3, car six,, .…, x, sont linéairement indépendants, ils constituent 
une base dans leur enveloppe linéaire. 
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Démontrons la seconde assertion. Si les vecteurs sont linéairement 
dépendants, on a l’égalité œ,x, + .. + æ,x, = o, où tous les coefficients 
@j, .…, @, Ne Sont pas nuls. En multipliant cette égalité scalairement par 
chacun des vecteurs x,, ..., x,, on aboutit au système d’équations linéaires 


a@,(xX,, X,) +. + a, (x,,Xx,) = 0, 


axe, Xx,) +. + a, (x, X4) = 0, 


vérifié par les coefficients æ,, ..…., æ,. Le système ayant une solution non 
triviale, le déterminant de sa matrice est égal à zéro, ce qu'il fallait démon- 
trer. 

Signalons que l’inégalité de Cauchy-Bouniakovski démontrée plus haut 
représente un cas particulier de ce théorème pour k = 2. 

6. Matrices orthogonales. Supposons que dans la formule (15), F = 
= l' =E£, autrement dit admettons que les deux bases sont orthonormées. 
La formule prend alors la forme 


SS = E. (16) 


DÉFINITION. On dit que la matrice est orthogonale si elle satisfait à la 
condition (16). 

On voit que les seules matrices orthogonales peuvent servir de matrices 
de passage d’une base orthonormée à l’autre. L'égalité (16) est équivalente 
à la suivante 


S=S"" (17) 
En vertu des propriétés de la matrice inverse, on a 
SS=E. (18) 


Cela signifie que la matrice 'S est également orthogonale. 
En désignant les éléments de la matrice S par o, , on peut écrire les égali- 
tés (16) et (18) respectivement ainsi : 


" 0, i+j 
& — 9 

Lite a9) 

Ke]! 

2 “ss , ; F ’ 

Z oioi = . (20) 

kml L i=)J 


La relation (19) peut d’ailleurs être obtenue directement par la formule (11) 
si l’on se souvient que les colonnes de la matrice de passage sont les colon- 
nes de coordonnées des nouveaux vecteurs de base par rapport à l’ancienne 
base. 
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En calculant le déterminant de chaque membre de l’égalité (16), on 
obtient (det S)? = 1. Aussi le déterminant de la matrice orthogonale est-il 
égal à +1 ou — 1. 

On invite le lecteur à vérifier toutes les relations de ce point pour la 


matrice | 
COS œ@  —Ssin 


sin @ COS 


7. Supplémentaire orthogonal d’un sous-espace. Considérons un sous- 
espace é, de dimension £ dans un espace euclidien &,, de dimension n. 


DÉFINITION. On appelle supplémentaire orthogonal du sous-espace &, 
l’ensemble de tous les vecteurs orthogonaux à chacun des vecteurs de é;. 
Le supplémentaire orthogonal du sous-espace &, est noté 6, *. 


PROPOSITION 4. Le supplémentaire orthogonal du sous-espace €, est un 
sous-espace de dimension n — K. 


DÉMONSTRATION. Soit Îa,, …, a,l une base dans €, . Le vecteur x appar- 
tient à &,* si et seulement si 


(x,a,) = 0,...,(x,a,) = 0. (21) 


En effet, si x appartient à €, *, les conditions (21) sont évidemment satisfai- 
tes. Inversement, si ces conditions sont satisfaites, x est orthogonal à tout 
vecteur a de é, puisque 


k k 
(x, a) = ( ù Wa, ) = Y Vx,a,) = 0. 


p= poli 


Choisissons dans é, une base orthonormée et désignons par as . œ les 
composantes du vecteur a, (pour tout p = 1, .…., K) et par £1, ...,t"les 
composantes du vecteur x. Les conditions (21) s’écrivent alors sous la 
forme du système homogène de £ équations linéaires à 7 inconnues : 


œiEl +... + at£" = 0, 


La matrice du système est de rang * puisque ses lignes sont linéairement 
indépendantes en tant que matrices-lignes des composantes des vecteurs 
a,,.…,a,. L'ensemble de toutes les solutions du système définit, comme on 
l’a montré, €,+. On connaît par ailleurs que l’ensemble de toutes les solu- 
tions de ce système définit un sous-espace de dimension 7 — £. La proposi- 
tion est démontrée. 

Considérons maintenant le supplémentaire orthogonal (“,*) : du sous- 
espace €, +. Il découle de la définition que “, & (4,*)*. Or, la dimension 
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de (6,*)* est n — (n — k) = k. Donc, selon la proposition 2 du $ 2, 
ch. VI,ona(é,”)" = 6. 

Il est évident que 4, et é,* n’ont pas de vecteurs communs non nuls, 
d’où la 

PROPOSITION 5. L'espace euclidien €, est la somme directe de l’un quel- 
conque de ses sous-espaces €, et du supplémentaire orthogonal de ce der- 
nier. 


Ainsi, selon la proposition 5 du $ 2, ch. VI, tout vecteur x de 6, se dé- 
compose de façon univoque en somme des vecteurs x ” de &, et x ” de &,”. 
Le vecteur x ‘ est appelé projection orthogonale de x sur &,. On voit immé- 
diatement que le vecteur x ”” est la projection orthogonale de x sur &,*. La 
longueur de x ” est appelée distance du vecteur x au sous-espace €, . Elle 
possède la propriété suivante de minimalité. 


PROPOSITION 6. Si le vecteur x représente la somme des vecteurs x° de €, 
et x” de &,*, tout vecteur y de &,, différent de x’, vérifie la relation 


IxT = 1x — x < lx — pl. 


DEMONSTRATION. En désignant x° — y par z, on obtient Ix — yl? = 
= [x = py+x = 1z+x = G+x”,z+ x) = 121? + 
+ 2(7,x 7) + 1x1? Mais (z, x”) = 0, vu que z se trouve dans &? et, par 
suite, 1x — yl? = 1x1? + 1212 Il s'ensuit immédiatement l’assertion 
nécessaire. 


$ 2. Transformations linéaires dans l’espace euclidien 


1. Transformation adjointe. Tout ce qui a été dit au chapitre précédent 
sur les transformations linéaires dans les espaces vectoriels s’applique éga- 
lement aux espaces euclidiens. Le produit scalaire introduit dans l’espace 
euclidien permet de définir des classes importantes de transformations que 
nous allons étudier dans ce paragraphe. L’exposé qui suivra se rapporte 
exclusivement aux espaces euclidiens réels. 


DÉFINITION. La transformation linéaire A* de l’espace euclidien est dite 
adjointe de la transformation donnée À si pour tous vecteurs x et y on a 
l'égalité 

(A(X),7) = (x, A° ©). (1) 


Admettons que la transformation donnée À possède une adjointe A*. 
Cherchons comment sont liées les matrices des transformations A et A° 
dans une base e. Désignons les matrices de ces transformations respective- 
ment par À et À *, et les colonnes de coordonnées des vecteurs x et y par £ 
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et #. L'égalité (1) s’écrit alors ainsi 
(AE = ETA°s#, 


où Fest la matrice de Gram de la basee. Après des transformations éviden- 


tes, on obtient 
ECAT-TA°} = 0. (2) 


Vu que £ et # sont des matrices-colonnes arbitraires, on peut en conclure 
que 
(Ar -r4°=0, (3) 


où © est la matrice nulle. Pour aboutir à cette conclusion, rappelons 
l'exemple 4 de la p. 160. On y a vu que pour toute matrice P et les colonnes 
e;ete; de la matrice unité le produit e;Pe ; est égal à l'élément p;; de la matri- 
ce P. En substituant à £ et # les colonnes de la matrice unité, on peut 
montrer que tout élément de la matrice ‘47 — FA * est égal à zéro. 

Ainsi donc, les matrices des transformations À et A° sont liées par la 
relation (3). En particulier, si la base est orthonormée et l = E,on a 


A° = "A. (4) 


PROPOSITION 1. Toute transformation linéaire de l’espace euclidien pos- 
sède une transformation adjointe et une seule. 


Pour le démontrer, choisissons une base orthonormeée et considérons la 
transformation B de matrice ‘4, si À est la matrice de la transformation 
donnée À. Pour la transformation B, la condition (1) est de toute évidence 
équivalente à '(A£}y = (Az). Donc, B est la transformation adjointe de 
A. S'il y avait deux transformations adjointes À, leurs matrices coïnci- 
deraient en vertu de (4). La proposition est démontrée. 

Puisque (4) = À, la formule (4) entraîne que 


(A° )° = A. (S) 


2. Transformations symétriques. DÉFINITION. La transformation linéaire 
A de l’espace euclidien est dite autoadjointe ou symétrique si À = AÀ*. 
Il découle immédiatement de la formule (4) la 


PROPOSITION 2. La transformation est symétrique si et seulement si sa 
matrice est symétrique (c'est-à-dire satisfait à la condition À = ‘A) dans 
toute base orthonormée. 


Les valeurs propres et les vecteurs propres des transformations symétri- 
ques possèdent une série de propriétés importantes et intéressantes à 
l’expose desquelles on va passer. 


THÉORÈME 1. Toutes les racines du polynôme caractéristique d’une 
transformation symétrique sont réelles. 


14— 6442 
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DÉMONSTRATION. Notons À la matrice de la transformation symétrique 
considérée dans une base orthonormée quelconque. Supposons que l’équa- 
tion caractéristique det (4 — ÀE) = 0 possède une racine complexe \,. 
Considérons le système d’équations linéaires 


(A — NE) = 0 (6) 


à n inconnues £!, .…, £" (n étant la dimension de l’espace). La matrice du 
système est complexe, de sorte que la solution £ est en général une matrice- 
colonne complexe. Puisque det (4 — À,E) = 0, il existe obligatoirement 
une solution non triviale. Soit £, une solution non triviale. Portons £, 
dans le système et multiplions à gauche les deux membres de l’égalité obte- 
nue par la matrice-ligne €, : 


ÆoAËo = No EE o- (7) 


Vu que EE, = EE! + … + ESES est un nombre réel strictement positif, 
pour aboutir à une contradiction il suffit de montrer que le nombre Œ oAËo 
est réel. En effet, posons w = ‘£,AË,. La matrice carrée d’ordre 1 ne varie 
pas par transposition, de sorte que 


w = wo = (EAËo) = Æo'AË 0: 
d’autre part, on a 
w = ÆoAËo- 
Or À est une matrice symétrique réelle et, par suite, À = A ='A.Ona 
donc w = w, d’où w est réel. En divisant les deux membres de l’égalité (7) 


par le nombre non nul '£ £,, on constate que X, est obligatoirement réel. 
L’assertion démontrée peut être formulée en termes de matrices. 


PROPOSITION 3. Si À est une matrice symétrique réelle, toutes les racines 
de l'équation det (4 — XE) = 0 sont réelles. 


THÉORÈME 2. Les vecteurs propres d’une transformation symétrique À, 
associés à différentes valeurs propres sont orthogonaux. 


En effet, soit À # u et A(x) = Àx, A(y) = uy. Alors 
(A(x), y) = AU, r). 
Or on peut obtenir d’une autre façon 
(A(X), y) = (x, AC) = ulx, y). 
Il ressort de ces deux égalités que (À — u)(x, y) = 0, d’où (x, y) = 0, ce 
qu’il fallait démontrer. 


THÉORÈME 3. Si le sous-espace € ” est invariant par la transformation 
symétrique À, il en est de même de son supplémentaire orthogonal (& ‘)*. 
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DÉMONSTRATION. On a par hypothèse que l’image A(x) de tout x de € ’ 
appartient à € ’. Cela signifie que (A(x), y) = 0 pour tout y de(é ‘):. La 
transformation À étant symétrique, on en déduit que (x, A(>)) = 0et, par- 
tant, A(») appartient à (€ ’)*, ce qui démontre le théorème. 

On est maintenant en mesure de démontrer le théorème qui permet de 
décrire toutes les transformations symétriques possibles. On l’appellera 
théorème fondamental des transformations symétriques. 


THÉORÈME 4. Soit À une transformation linéaire symétrique dans 
l’espace euclidien €, de dimension n. Il existe alors dans €’, une base ortho- 
normée des vecteurs propres de la transformation A. 


Raisonnons par récurrence sur la dimension n# de l’espace &,. Pour un 
espace unidimensionnel € le théorème est évident, car chaque vecteur dans 
cet espace est un vecteur propre de À, de sorte qu’il suffit de prendre pour 
base cherchée tout vecteur de longueur 1. 

Supposons maintenant que le théorème est démontré pour un espace de 
dimension # — 1 et démontrons-le pour un espace de dimension &. Selon le 
théorème 1, la transformation symétrique À de €, a au moins une valeur 
propre *)et, par suite, au moins un sous-espace invariant unidimensionnel. 
Désignons ce sous-espace par & et son vecteur unitaire par e. En vertu du 
théorème 3, le supplémentaire orthogonal &,_, du sous-espace “ est un 
sous-espace de dimension # — 1, également invariant par A. 

Considérons la restriction A’ de la transformation À au sous-espace 
6, (voir p. 193). On constate aisément que c’est une transformation sy- 
métrique dans €, :,. En effet, l'égalité (A(x), y) = (x, AG)) est vérifiée 
par tous les vecteurs de €, et, par suite, par tous les vecteurs de , _,, pour 
lesquels d’ailleurs on a, par définiton, A’(x) = A(x). Si x est un vecteur 
propre de la transformation A”, il est aussi un vecteur propre de À vu que 
A'(x) = A(x) = x. 

Par hypothèse de récurrence, il existe dans €, _ , une base orthonormée 
le,, .…,e,_,l des vecteurs propres de la transformation A”. Considérons 
le système des vecteurs e,, .…,e,_,,e. Tous ces vecteurs sont deux à deux 
orthogonaux : e,, ...,e,_, par construction, et e est orthogonal à chacun 
d’eux car €, _, est le supplémentaire orthogonal de €. La longueur de cha- 
cun des vecteurs considérés est 1. Chacun d'eux est un vecteur propre de la 
transformation A. Ainsi donc, le système des vecteurs e,, ..….,e,_,,e est la 
base qu’on devait construire. 

Le théorème démontré autorise une représentation matricielle. 


PROPOSITION 4. Si À est une matrice symétrique, il existe une matrice 
orthogonale S telle que S ‘AS soit une matrice diagonale. 


*) Dans le « pire » des cas, toutes les racines du polynôme caractéristique coïncident, de 
sorte que À a une seule valeur propre. 
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En effet, la matrice À rapportée à une base orthonormée définit la 
transformation symétrique. Pour S on peut prendre la matrice de passage 
de cette base à la base construite dans le théorème. Rappelons que la 
matrice d’une transformation est diagonale par rapport à la base des vec- 
teurs propres de cette transformation (proposition 6, $ 4, ch. VI). 

Cn a déjà étudié dans le théorème 1 du $ 3, ch. IV, la transformation 
affine du plan, consistant en contraction (traction) suivant deux directions 
perpendiculaires. La généralisation d’une telle transformation dans 
l’espace euclidien 7-dimensionnel des vecteurs est la contraction (traction) 
suivant 7 directions deux à deux perpendiculaires. Choisissons une base 
orthonormée de manière que ses vecteurs possèdent ces directions. Chaque 
vecteur de base e; se transforme alors en vecteur Xe; qui lui est proportion- 
nel, où X\, est le coefficient de contraction. (Cette propriété représente juste- 
ment la définition correcte de la contraction suivant des directions deux à 
deux perpendiculaires.) Rapportée à cette base, la matrice de la transfor- 
mation étudiée est une matrice diagonale, et ses éléments diagonaux sont 
les coefficients de contraction. Vu que la matrice diagonale est symétrique 
et la base est orthonormée, la contraction suivant n directions deux à deux 
perpendiculaires est une transformation symétrique. | 

Inversement, en vertu du théorème 4, toute transformation symétrique 
dont les valeurs propres sont strictement positives est une contraction sui- 
vant 7 directions deux à deux perpendiculaires. A la valeur propre nulle, 
correspond non pas une contraction mais un projecteur orthogonal, tandis 
qu’à une valeur propre strictement négative est associé le produit d’une 
contraction par une symétrie. | 

Si ° est une valeur propre de multiplicité s, il lui correspond un sous- 
espace invariant €. de dimension s. En effet, s’il n’en était pas ainsi, il 
n’existerait pas de base formée des vecteurs propres : la somme de toutes 
les multiplicités vaut n, quant au nombre de vecteurs linéairement indépen- 
dants associés à chaque valeur propre il ne peut dépasser sa multiplicité. 

Pour À* > O, la restriction de la transformation À à cet espace inva- 
riant 6’ est une homothétie, autrement dit une contraction uniforme sui- 
vant toutes les directions, de coefficient À°. 

Etudions maintenant la méthode de recherche pratique de la base dont 
l'existence est démontrée dans le théorème. Choisissons une base (de préfé- 
rence, orthonormée) et considérons la matrice de cette transformation. 
Cherchons les racines de son polynôme caractéristique det (4 — ÀE) = 0 
et, pour chaque racine, déterminons les vecteurs propres en résolvant le 
système d’équations (4 — AE Ë = o. Pour les racines simples, il reste à 
normer les solutions non triviales. Pour la racine de multiplicité s, on 
obtient un système fondamental de s solutions. Ce sont des vecteurs pro- 
pres linéairement indépendants et en général non orthogonaux. On doit les 
orthogonaliser et normer. 
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3. Isomorphisme d'espaces euclidiens. DÉFINITION. Les espaces eucli- 
diens €” et €” sont dits isomorphes s’il existe une application linéaire bi- 
jective À : & — €‘ telle que 


(A(x), AC) = (x, y) (8) 


pour tous x et y de €. L'application À est appelée isomorphisme d'espaces 
euclidiens. 

Ainsi, le terme «isomorphisme» prend des significations variées suivant 
le contexte. S’il s’agit d'espaces euclidiens, l’isomorphisme, tout en conser- 
vant les résultats d’opérations linéaires, conserve aussi le produit scalaire. 

Pour que deux espaces euclidiens soient isomorphes, il est évidemment 
nécessaire qu'ils soient de même dimension, sinon, ils ne sont pas iso- 
morphes même en tant qu'espaces vectoriels. Il s’avère que cette condition 
est également suffisante. 


THÉORÈMES. Deux espaces euclidiens de même dimension sont toujours 
isomorphes. Les espaces euclidiens de dimensions différentes ne sont pas 
isomorphes. 


Pour démontrer la première assertion, choisissons dans chacun des 
espaces considérés € et €” une base orthonormée. Définissons l’applica- 
tion À : € — €‘ en faisant correspondre des vecteurs qui possèdent les 
mêmes colonnes de coordonnées dans les bases choisies. La matrice de cette 
application est la matrice unité, de sorte que l’application À est un isomor- 
phisme des espaces & et &” considérés comme des espaces vectoriels. La 
formule (11) du $ 1 entraîne que cette application conserve le produit sca- 
laire. 

Il est opportun de signaler que la condition (8) est très forte. On en 
déduit que À est une application linéaire et de plus injective. En effet, con- 
sidérons un vecteur quelconque x de < et un nombre arbitraire æ. Le carré 
scalaire du vecteur A(œx) — aA(x) de & ” peut être écrit sous la forme 


(A(ax), A(ax)) — 2a(A(ax), A(x)) + æ?(A(x), A(x)). 


Compte tenu de (8), on voit que cette expression est égale à (ax, ax) — 
— 2a(ax, x) + aœ?(x, x), c’est-à-dire à zéro. Ainsi, A(aæx) = aA(x). De 
façon analogue, on démontre que A(x + y) = A(x) + AU). 

Supposons ensuite que le vecteur x appartient au noyau de l’applicaton 
A, c’est-à-dire que A(x) = o. Cela signifie que (A(x), A(x)) = 0 et, en 
vertu de (8), que (x, x) = 0. Donc, le noyau de À est le sous-espace nul, et 
A une injection. 

Dans le cas général, l’application À satisfaisant à la condition (8) n’est 
pas bijective : elle peut être un isomorphisme de € sur un sous-espace 
de ©’. 
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Supposons que la dimension m de l’espace é”” est égale à la dimension 
n de l’espace “ À étant une injection, son rang r est égal à n et par suite, 
m = n = r. Selon la proposition 6 du $ 3, ch. VI, À est un isomorphisme. 
On a ainsi démontré la proposition suivante. 


PROPOSITION 5. Une application de l’espace euclidien €, dans l’espace 
euclidien €,” de même dimension est un isomorphisme si elle conserve le 
produit scalaire. 


4. Transformation orthogonale. La transformation A de l’espace eucli- 
dien < est dite orthogonale si elle conserve le produit scalaire; c’est-à-dire 
si la condition (8) est satisfaite pour tous les vecteurs de 

Il ressort de la proposition 5 que la transformation orthogonale est un 
isomorphisme de < sur lui-même. 


PROPOSITION 6. La transformation adjointe d'une transformation ortho- 
gonale est égale à la transformation réciproque : A° = Ari. 


En effet, d’après la formule (8) on a (x, A° o A(y)) = (x, y) ou 
(x, A° o A(y) — y) = 0. Cela signifie que le vecteur A° © A(y) — y est 
orthogonal à tout vecteur de l’espace et, par suite, est nul. L'égalité 
A° o A(y) = }y étant vérifiée pour tous les vecteurs, la transformation 
A° o A estidentique, d’où la proposition 6. 


CoROLLAIRE. Dans une base orthonormée, la matrice de la transforma- 
tion orthogonale est orthogonale :'AA = E. 


PROPOSITION 7. Les racines du polynôme caractéristique d'une transformation orthogo- 
nale À (y compris les racines complexes) sont en valeur absolue égales à l'unité. 


Soient À la matrice de À dans une base orthonormée, et À une racine (peut-être complexe) 
de l'équation det (4 — XE) = 0. Le système d'équations (4 — AE Ë = o, a, en général, une 
solution non triviale complexe. Il ressort de l'égalité AE = À£ que € ‘4 = À. Multiplions à 
gauche chaque membre de la première égalité par le membre correspondant de la seconde : 
Œ'A AE = AXE. Vu que À = À,'4A = Et 'Œ£ # O on a XX = 1, ce qu'il fallait démon- 
trer. 


PROPOSITION 8. Si “ ‘ est un sous-espace invariant par la transformation orthogonale À, 
le supplémentaire orthogonal (“ ")* du sous-espace <’* est également invariant. 


Pour le démontrer, signalons que la restriction A’ de la transformation À à “” est une 
transformation orthogonale et, partant, bijective. Elle est, en particulier, une surjection. 
Ainsi donc, si x appartient à <’’, il en est de même du vecteur A7 !(x). 

Soit y un vecteur quelconque de (< °)*. Il nous faut démontrer que son image A(y) est 
orthogonal à tout vecteur x de “’.On a 


(x, AG) = (AT (x), y) = 0, 
puisque y est orthogonal à tout vecteur de “ ‘’. La proposition est démontrée. 


THÉORÈME 6. Soir À une transformation orthogonale dans un espace euclidien “ de 
dimension n. “, est alors une somme directe d'espaces uni- et bidimensionnels invariants 
par À. 
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DÉMONSTRATION. Toute transformation orthogonale dans un espace euclidien a au moins 
un espace invariant uni- ou bidimensionnel, vu que son polynôme caractéristique posséde au 
moins une racine réclle ou complexe. : 

En nous appuyant sur ce fait, démontrons le thcorème par récurrence. Pour les espaces 
uni- et bidimensionnels, l’assertion ne fait aucun doute. Supposons qu'on a déjà démontre le 
théorème pour les espaces de dimensions £ — 1 et À — 2 et démontrons-le pour un espace de 
dimension £. Il existe dans €, un sous-espace invariant uni- ou bidimensionnel <* et son sup- 
plémentaire orthogonal (< ‘ 2 est un sous-espace invariant de dimension # — 1 ouk — 2res- 
pectivement. Appliquons l'hypothèse de récurrence à la restriction A’ de la transformation À 
sur (<")*. Les sous-espaces < ”, 4°”, …, en lesquels se décompose ( ’)! seront aussi 
invariants par À. Vu que “, est la somme directe de "et (7°) +,et  : L + est la somme 
directe dd ”, AT espace “, est la somme directe de <”, ” . Le théorème 
est démontré. 

On peut supposer que les sous-espaces invariants bidimensionnels ne renferment pas des 
sous-espaces invariants unidimensionnels. En effet, si un sous-espace invariant bidimension- 
nel &, contient un sous-espace unidimensionnel <, il contient aussi un second sous-espace 
invariant unidimensionnel #, + qui est le supplémentaire orthogonal du premier jusqu'à “.. 
Re 5, est la somme directe def, #, + et dans la décomposition de dé, on peut ernplacer 

Æ, par deux termes 4, et 4”. 

Choisissons une base orthonormée dans chacun des sous-espaces invariants bi- et unidi- 
mensionnels en lesquels se décompose €, et réunissons ces bases. On obtient la base orthonor- 
mée Île,, …, e,Î dans “,. Construisons la matrice À de la transformation À par rapport à 
cette base. 

Supposons que le vecteur de base e, appartient à un espace invariant unidimensionnel, 
autrement dit est propre. En vertu de la proposition 5, la valeur propre associée est 1 ou — 1, 
de sorte que tous les éléments de la i-ième colonne de la matrice sont nuls, à l'exception de 
l'élément «; sur la diagonale principale, égal à 1 ou —1. 

Considérons les vecteurs de basece, ete, , , qui appartiennent au sous-espace invariant 
bidimensionnel €”. Les vecteurs A(e,) et A(e,, ,) ne se décomposent que suivant les vecteurs 
e,cte,,,, et par suite, tous les éléments dans la &-ième et la (4 + 1)-ième colonne de la 
matrice À sont nuls à l’exception du bloc d'ordre deux 


k k 

|" Xg Xp] | 
k+! k+! 
ag Xx+] 


de la diagonale principale. Ce bloc est la matrice de la transformation À” qui est la restriction 
de À au sous-espace €”. Selon la proposition 6 du $ 2, ch. IV, la matrice de la transformation 
orthogonale dans un espace bidimensionnel prend par rapport à la base orthonormée la forme 


| COSY  Fsiny 
sin Y + cos 


où les signes supérieurs sont pris pour les transformations orthogonales de première espèce et 
les signes inférieurs pour les transformations de seconde espèce. Si l’on prend les signes infé- 
rieurs, la matrice devient symétrique, de sorte que la transformation orthogonale de seconde 
espèce est symétrique, par suite, possède deux sous-espaces invariants unidimensionnels. Le 
résultat obtenu contredit l'hypothèse faite plus haut. Donc, il existe un nombre », tel que 


|" ak AE | cos», -siny, | 
k+) k+1 : É 
y Ak4) sin @y cos #, 


Laissons au lecteur le soin d'écrire la forme générale de la matrice À. 
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$ 3. Notion d’espace unitaire 


1. Définition. On montrera dans ce paragraphe comment se définit le 
produit scalaire dans des espaces vectoriels complexes. On s’abstiendra 
cependant de fournir des démonstrations qui peuvent être obtenues, avec 
de légères modifications, à partir des démonstrations données pour les pro- 
positions correspondantes au $ 1. Tous les nombres sont ici en général des 
nombres complexes. 

Considérons un espace vectoriel complexe _/ et supposons qu’il existe 
une relation qui fait correspondre à chaque couple de vecteurs x et y le 
nombre (x, y). Il s’avère que les axiomes mentionnés dans la définiton de 
l’espace euclidien ne peuvent pas être vérifiés. En effet, soit x un vecteur 
non nul. L’espace étudié est muni de la multiplication d’un vecteur par un 
nombre complexe, de sorte qu’on peut prendre le vecteur ix, où i est l’unité 
imaginaire. Si les axiomes 1° et 2° sont vérifiés, on a l’égalité 


(x, 1x) = —(x, x). 


Avec un produit positif à droite, le produit à gauche est négatif, ce qui con- 
tredit l’axiome 4°. 

Ce fait oblige d’introduire d’autres définitions du produit scalaire dans 
des espaces complexes. Dans l’une d’elles, on remplace l’axiome 4° par une 
condition moins rigoureuse : on exige que (x, y) = 0 quel que soit x impli- 
que y = 0. L'espace vectoriel complexe muni d’un produit scalaire ainsi 
défini s’appelle espace euclidien complexe. Les espaces euclidiens com- 
plexes sont relativement peu utilisés. Beaucoup plus souvent dans les appli- 
cations, on rencontre des espaces dits unitaires. 


DÉFINITION. L’espace vectoriel complexe _/ est dit unitaire (ou hermi- 
tien) s’il existe une relation qui fait correspondre à tout couple de vecteurs x 
et y de / un nombre complexe (x, y), et telle que sont vérifiés les axiomes 
suivants, quels que soient les vecteurs x, y et z et le nombre a : 

1° (x, y) = (y, x), c’est-à-dire que lorsqu'on permute les facteurs, on 
remplace le produit scalaire par le nombre complexe conjugué; 

2° (ax, y) = ax, y); 

3° (x + y, 2z) = (x, z) + (y, 2); 

4° (x, x) > 0, si x € o. 

Le nombre (x, y) est appelé produit scalaire des vecteurs x et y. 

Remarquons que pour tout vecteur xona(x,x) = (x, x)et, par suite, le 
carré scalaire du vecteur est toujours un nombre réel. L’axiome 4° exige 
que ce nombre soit strictement positif pour x # o. 

Les axiomes 1° et 2° impliquent la règle suivante de mise en facteur sca- 
laire : 


(X, ay) = (ay, x) = a(y, x) = a(y, x) 
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(comp. (4), $ 7, ch. V). En définitive, 
(x, ay) = a(x, y). (1) 


La longueur du vecteur et l’angle de deux vecteurs se définissent par les 
mêmes formules que dans le cas réel. La longueur du vecteur est toujours 
définie par le nombre réel positif. L’angle est en genéral défini par le nom- 
bre complexe. 

Les vecteurs sont dits orthogonaux si leur produit scalaire est nul. Seul 
le vecteur nul est orthogonal à tout vecteur. 

Signalons qu’on a l'inégalité 


(x, x)0, 7) > 1(x, p)l° = (x, »)0, x). 


Elle se démontre de la même façon que l’inégalité (7) du $ 1, compte tenu 
de ce que 


(ax + By, ax + By) = aa(x, x) + aB(x, y) + Ba(y, x) + BB(>, y). 


EXEMPLE ]. L’espace vectoriel complexe des matrices-colonnes à n élé- 
ments devient un espace unitaire de dimension n si le produit scalaire des 
matrices-colonnes £ et # est défini par la formule 


Em) = Et! +... + Em. (2) 
En effet, en appliquant cette formule, on a aussi 
@,E) = n'Et +. + n'en. 


Il ressort des formules (3) et (4) du 8 7, ch. V, que &,#) = (#, £). 

Les axiomes 2° et 3° découlent des propriétés de la multiplication des 
matrices si l’on remarque que le second membre de (2) est le produit ‘£#, 
où æ est la matrice-colonne composée des éléments n!, …, 7". Enfin, 


Œ,E) = EME +. + EME" = lEU2 + + EE (3) 


et, par suite, le carré scalaire de la matrice-colonne est positif; il est égal à 
zéro si la matrice-colonne est nulle. 

EXEMPLE 2. On peut construire un espace unitaire unidimensionnel de la 
façon suivante. Considérons l’ensemble de tous les vecteurs d’un plan, 
muni de l’opération d’addition définie par la règle du parallélogramme. 

Pour définir l’opération de multiplication par un nombre complexe, 
choisissons une base orthonormée (dans le sens habituel) Île,, e,l. On 
appellera produit du vecteur x de composantes £!, £? par le nombre « + iB 
le vecteur de composantes œ£! — B£?et œt? + Bt!. Le sens de cette défini- 
tion est le suivant. À chaque vecteur on peut faire correspondre un nombre 
£! + it? ; ceci étant, la correspondance entre les nombres et les vecteurs est 
biunivoque : à tout vecteur est associé un nombre et un seul et à tout nom- 
bre est associé un vecteur et un seul. Au produit (œ + iB)x est associé le 
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nombre (« + iB)(£! + it*). Signalons qu’à la somme des vecteurs corres- 
pond la somme des nombres associés à ces vecteurs. 

Voyons si les axiomes de l’espace vectoriel y sont vérifiés. Les quatre 
premiers axiomes se rapportant à l’addition des vecteurs sont évidemment 
vérifiés. Les égalités (À + u)x = Àx + ux et À(X + y) = Àx + Ày se dédui- 
sent de la distributivité de la multiplication des nombres complexes. L’éga- 
lité A(ux) = (Aux découle de l’associativité de la multiplication. Il est aussi 
évident que 1x = x. On a donc un espace vectoriel complexe. Sa dimension 
est 1, car tout vecteur x est égal à (£! + i£*)e,, où £! + i£* est un nombre 
complexe défini par le vecteur x. La base est représentée par le vecteur e.. 


Définissons le produit scalaire des vecteurs x = Xe, et y = ue, par la 
formule (x, y) = Àu. Il est aisé de vérifier que tous les axiomes de la multi- 
plication scalaire pour un espace unitaire sont satisfaits. 

La longueur unitaire du vecteur (1 + i)e, est V2. Le produit scalaire 
(e,,e,) = (e,,ie,) = —i, bien que relativement au produit scalaire dans le 
plan réel les vecteurs e, et e, sont perpendiculaires. 

2. Propriétes des espaces unitaires. Toutes les propriétés étudiées des 
espaces euclidiens se rapportent avec d’infimes modifications aux espaces 
unitaires. 

Il existe dans un espace unitaire de dimension finie une base orthonor- 
mée, c’est-à-dire une base formée de vecteurs de longueur unité deux à 
deux orthogonaux. Une telle base peut être obtenue à partir d’une base 
quelconque par orthogonalisation. 

Le produit scalaire s'exprime en fonction des composantes des facteurs 
par rapport à une base orthonormée suivant la formule 


(x, p) = En! + … + Em. 


Pour une base arbitraire on introduit la matrice de Gram F dont les élé- 
ments sont les produits scalaires des vecteurs de base pris deux à deux. Le 
produit scalaire des vecteurs x et y dont les colonnes de coordonnées sont £ 
et # s’exprime par la formule 


(x, y) = 'ETn. 
Vu que (e,, e;) = (e;, e,) dans un espace unitaire, la matrice de Gram 
satisfait à la condition 
= PF: (4) 
(Ici et plus loin le trait au-dessus de la matrice signifie le passage de tous ses 
éléments aux nombres complexes conjugués.) 


DÉFINITION. Toute matrice satisfaisant à la condition (4) est dite hermi- 
tienne. 
La matrice de passage S d’une base orthonormée de l’espace unitaire à 
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une autre base orthonormée doit vérifier l’égalité 
ISS = E. (S) 
Cela signifie que S =! = ‘S, d’où il vient que 
S'S = E. 


DÉFINITION. La matrice S est dite unitaire si elle vérifie l’égalité (5). 
Remarquons que l’égalité (5) et la formule (7) du $ 7, ch. V, entraînent 


det ('SS) = det 'S det S = (det S)(det S) = Idet Si? = 1, 


de sorte que le déterminant de la matrice unitaire est un nombre complexe 
de module égal à l’unité. 

Le supplémentaire orthogonal d’un sous-espace de l’espace unitaire se 
définit de la même façon que dans l’espace euclidien. De la même manière 
on démontre que le supplémentaire orthogonal du sous-espace de dimen- 
sion £ est un sous-espace de dimension ñ7 — K. 

3. Transformations auto-adjointes et unitaires. La transformation d’un 
espace unitaire est dite auto-adjointe si pour tous vecteurs x et y est vérifiée 
l'égalité 

(A(x), y) = (x, AG). 


Il découle de cette définition que la transformation de l’espace unitaire est 
auto-adjointe si et seulement si sa matrice est hermitienne dans toute base 
orthonormée. Aux transformations auto-adjointes d’espaces unitaires se 
rapportent sans changements les théorèmes 1 à 4 du $ 2. 

On dit qu’une transformation de l’espace unitaire est unitaire si elle 
satisfait pour tous vecteurs x et y à la condition 


(A(x), AC) = (x, y). 


On vérifie aisément que la transformation est unitaire si et seulement si sa 
matrice est unitaire dans toute base orthonormée. 


CHAPITRE VIII 


FONCTIONS SUR L’ESPACE VECTORIEL 


$ 1. Fonctions linéaires 


1. Définition d’une fonction. De même qu’au chapitre VI, on considère 
un espace vectoriel quelconque. Dans le cas où la différence entre les espa- 
ces réels et complexes serait essentielle, on introduira des données supplé- 
mentaires. Si le terme « nombre » n'est pas précisé, on sous-entend un 
nombre complexe dans le cas de l’espace complexe, et un nombre réel dans 
le cas de l’espace réel. En règle générale, le produit scalaire n’est pas intro- 
duit, mais de nombreux résultats se rapportent aux espaces euclidiens. 


DÉFINITION. On dira qu’une fonction (d’un vecteur) est définie sur 
l’espace vectoriel _/ si à chaque vecteur x de _Z est associé un nombre. Une 
fonction de deux vecteurs est définie sur si à chaque couple ordonné de 
vecteurs x, y de ” est associé un nombre. 

Le nombre que la fonction f fait correspondre au vecteur x s’appelle 
valeur de la fonction Î sur x et se note f(x). De façon analogue on définit la 
valeur g(x, y) de la fonction g de deux vecteurs. 

Les fonctions sur les espaces de dimension infinie sont généralement 
appelées fonctionnelles. 

Soit Æ# un espace de dimension n rapporté à une base. A chaque vec- 
teur x de Z on peut alors associer ses 7 composantes £!, …, £". Rappelons 
qu’en analyse mathématique on appelle fonction de n variables une rela- 
tion faisant correspondre un nombre à tout #7-uple ordonné de nombres 
(£!, .…, £") de l’ensemble donné. Ainsi donc, la base étant choisie, la fonc- 
tion f sur l’espace vectoriel Æ se détermine par la fonction de n variables 
définie pour tous les 7-uples possibles (£!, .…, £7). Si on change de base, on 
associe à tout vecteur x ses nouvelles composantes £’!,...,£’” et, par suite, 
la fonction f se détermine par une nouvelle fonction de #7 variables. 

2. Fonctions linéaires. DÉFINITION. La fonction f sur un espace vectoriel 
_Z est dite linéaire si pour tous vecteurs x et y de et tout nombre æ on a 


f(x + y) = f(x) + CO), fax) = af(x). (1) 


Le lecteur notera que la notion de fonction linéaire sur un espace vecto- 
riel ne lui est pas étrangère. C’est exactement la même chose qu’une appli- 
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cation linéaire de l’espace vectoriel donné dans un espace arithmétique uni- 
dimensionnel (comp. exemple 3), $ 3, ch. VI). 


EXEMPLE 1. La fonction qui associe à chaque vecteur le nombre zéro est 
linéaire. Une fonction faisant correspondre à tous les vecteurs un même 
nombre non nul ne peut être linéaire car pour chaque fonction linéaire on a 
f(o) = 0. On invite le lecteur à vérifier ces assertions. 


EXEMPLE 2. Soit €, un espace euclidien de dimension n et soit a un vec- 
teur fixé de €. A chaque vecteur x de “, on peut alors faire correspondre 
le nombre t = (a, x). Les égalités (1) sont évidemment vérifiées et on a 
donc une fonction linéaire sur “,. 


EXEMPLE 3. Soit dans l’espace vectoriel 7, une base lle,, ...,e,l. Asso- 
cions à chaque vecteur x sa i-ième composante £' dans cette base. Cette cor- 
respondance est évidemment une fonction linéaire sur 7. On la notera p!. 
On peut ainsi construire n fonctions p', .…, p". Elles dépendent évidem- 
ment de la base choisie. | 


EXEMPLE 4. Considérons un espace vectoriel de dimension infinie, 
constitué de fonctions d’une seule variable indépendante £, définies et con- 
tinues pour 0 < £ < 1. Soit v(£) une fonction fixée de , par exemple 
v(£) = sin £. On peut alors faire correspondre à chaque fonction u(£) de 
Z le nombre 


F = (u(E)u(E)dé. 
0 


Il est évident que cette correspondance est une fonctionnelle linéaire. D’ail- 
leurs, si l’on se rappelle l’exemple 3 du $ 1, ch. VII, il devient évident que 
cette fonctionnelle est construite de la même façon que la fonction linéaire 
de l’exemple 2. 

On obtiendra encore une fonctionnelle linéaire sur le même espace À si 
l’on associe à chaque fonction u(£) de Z sa valeur u(0) pour £ = 0. 

Soit un espace vectoriel quelconque , de dimension nr rapporté à une 
base le,, …, e,l. La valeur de la fonction f sur le vecteur x de 7, peut être 
écrite au moyen des composantes de ce vecteur £!, .., £": 


f(x) = fe, + … + Efe,) = E'f(e,) + … + E"f(e,). 
Les nombres f(e,), .…, f(e,) sont indépendants du vecteur x et ne sont défi- 


nis que par la fonction f et la base lle,, ..,e, |. On a ainsi démontré la pro- 
position suivante. 


PROPOSITION 1. Toute fonction linéaire sur un espace vectoriel de dimen- 
sion n rapporté à une base Île,, …, el se définit par un polynôme linéaire 
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n 
1GmOgENE fx) = LE! + + LE", (2) 
où £!, .…, £" sont les composantes du vecteur x par rapport à cette base, et 
X,, .…, X, les coefficients du polynôme qui sont égaux aux valeurs de la 
fonction sur les vecteurs de base. 


Il est commode de dire que les valeurs de la fonction f sur les vecteurs de 
la basee sont les composantes (ou coefficients) de la fonction f dans la base 
e. La matrice de l’application linéaire d’un espace de dimension # dans un 
espace unidimensionnel est de type (1, 7), autrement dit est une matrice- 
ligne à 7 éléments. Dans le cas considéré, c’est la matrice-ligne [lx, ... x, l. 
Laissons au soin du lecteur de le vérifier. La formule (2) s'écrit sous forme 
matricielle ainsi : 


£! 
f(x) = Lx, HA | = XE. (3) 
£" 


On s’aperçoit aisément que chaque matrice-lignex definit par la formu- 
le (3) une fonction linéaire. En effet, x (£ + æ) = x£ + x etx(oË) = 
= a(r£). 

La formule (6) du $ 3, ch. VI, exprime la matrice de l’application par 
rapport aux nouvelles bases au moyen de l’ancienne matrice de cette appli- 
cation et les matrices de passage aux nouvelles bases. Etant donné que dans 
l’espace arithmétique unidimensionnel la base est fixée une fois pour tou- 
tes, cette formule prend pour une fonction linéaire la forme 


xX° =xS. (4) 


x est ici la matrice-ligne des coefficients de la fonction dans la basee, etx” 
la matrice-ligne de ses coefficients dans la basee” = eS. Il est évident que 
la formule (4) peut être obtenue directement. En effet, écrivons f(x) dans 
chacune des deux bases : f(x) = x£ = x'£ ’. D’où, selon la formule (3) du 
S 1, ch. VI, xS£° = x'£" ou (xS — x'X' = 0, avec £ ’ une matrice- 
colonne arbitraire. En portant successivement à sa place chaque colonne de 
la matrice unité, on s’apercevra que chaque élément de la matrice-ligne 
xS — x° vaut zéro. 

3. Espace dual. Dans le chapitre VI, on a introduit les définitions de la 
somme d’applications linéaires et du produit d’une application linéaire par 
un nombre. Rapportées aux fonctions linéaires ces définitions sont formu- 
lées ainsi : 

DÉFINITION. On appelle somme des fonctions linéaires { et g la fonction 
h dont la valeur sur chaque vecteur x est définie par l’égalité h(x) = f(x) + 
+ g(x). On appelle produit de la fonction linéaire f par un nombre a 
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la fonction g dont la valeur sur chaque vecteur x est définie par l’égalité 
g(x) = af(x). 


PROPOSITION 2. Soient Î et g des fonctions linéaires sur l’espace vectoriel 
—, et x et À leurs matrices-lignes des coefficients dans une base e. La som- 
me Ÿ + g est alors une fonction linéaire dont la matrice-ligne des coeffi- 
cients par rapport à la base e est x + À. De même, pour un nombre quel- 
conque à, le produit af est une fonction linéaire dont la matrice-ligne des 
coefficients par rapport à la base e est ox. 


Pour des applications linéaires quelconques on l’a démontré dans le 
point 6 du $ 3, ch. VI. Reproduisons, toutefois, cette démonstration pour 
le cas de la somme de fonctions linéaires. Pour un vecteur arbitraire x, les 
valeurs de f et de g s’écrivent dans la basee sous forme dex£ et À£. La va- 
leur de la somme f + g sur le même vecteur est alors égale àx£ + À£ = 
= c + À. Il s'ensuit que f + g est une fonction linéaire dont la matrice- 
ligne des coefficients est x + À. 


PROPOSITION 3. L'ensemble / * de toutes les fonctions linéaires sur 
l'espace vectoriel /, de dimension n, muni des opérations d’addition et de 
multiplication par un nombre introduites ci-dessus est un espace vectoriel 
de dimension n. 


En effet, il existe une application bijective de l’ensemble / * sur 
l’ensemble des matrices-lignes à 7 éléments. Selon la proposition 2, l’image 
par cette application de la somme de fonctions est la somme des matrices- 
colonnes, et l’image du produit de la fonction par un nombre est le produit 
de la matrice-ligne par ce nombre. Etant donné que les axiomes de l’espace 
vectoriel sont vérifiés pour les opérations sur les matrices-lignes, ils le 
seront pour les opérations dans / *. Donc,  * est un espace vectoriel iso- 
morphe à l’espace des matrices-lignes à n éléments. 


DÉFINITION. L'espace vectoriel / * de toutes les fonctions linéaires défi- 
nies sur l’espace vectoriel / est dit dual de l’espace /. 

Choisissons dans l’espace /, une base e et considérons des fonctions 
linéaires p' (i = 1, .…., n) définies par les égalités p'(x) = £', où £' est la 
i-ième composante du vecteur x (comp. exemple 3). Cela signifie que 
0, i+#)j, 


p'(e,) = | (CS) 


l, =), 
c’est-à-dire que la matrice-ligne des coefficients de la fonction p' est la 
i-ième ligne de la matrice unité. Il en découle aussitôt que les fonctions 
p',.…,p" sont linéairement indépendantes. 

La matrice-ligne x = Îx,...x, ll se décompose suivant les lignes de la 
matrice unité, avec coefficients x,, .…., x,. Cela signifie que l’élément f de 
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l’espace “ * dont la matrice-ligne des coefficients est Îlx, x, ll a pour dé- 


composition 
f= xipl +... +x p". (6) 


Ainsi, Ip', …, p"ll est la base dans l’espace *. 


DÉFINITION. La base llp', .…, p"i de l’espace “* définie par la formule 
(5) est dite duale (ou biorthogonale) de la base le,, .…, e,l de l’espace À. 

Considérons la matrice-colonne p composée des fonctions p'. On peut 
maintenant présenter la décomposition (6) sous la forme matricielle : 


p! 
f= lx,...x, | [?. Le (7) 
p' 


Si l’on convenait d’écrire les composantes d’un vecteur de l’espace * 
sous forme de matrice-colonne, la formule (7) se présenterait comme suit : 
f = PD'x. 

Supposons que les bases e ete” de l’espace /, sont liées par l'égalité 
e’ = eS. Cherchons la matrice de passage entre les bases duales p etp”. A 
cet effet, écrivons la formule (4) sous la forme (3), $ 1, ch. VI, en la résol- 
vant relativement aux anciennes composantes et en écrivant les composan- 
tes sous forme de matrice-colonne. Il vient 


m= (SJ: 


On voit donc que la matrice de passage de la base p à la base p' dans 
l’espace * est la matrice S-!), c’est-à-dire qu’on a l’égalité p° = 
= Pp'(S”!). Si l’on revient, pour l’espace 7", à l’écriture des éléments de 
base sous forme de matrice-colonne, la dépendance entre les bases prendra 


la forme 
p = D. (8) 


L'espace ,* est un espace vectoriel comme tous les autres, si bien quil 
possède un espace dual /,** dont les éléments sont des fonctions linéaires 
sur 77. 


PROPOSITION 4. L'espace  ** peut être identifié à /,. 


DÉMONSTRATION. Fixons un vecteur x de /,, et faisons correspondre à 
chaque élément f de * le nombre f(x). On peut donc interpréter x comme 
une fonction sur -,*. Cette fonction est linéaire. En effet, (f + gj)(x) = 
= f(x) + g(x) et, par suite, à la somme des éléments de ,* la fonction x 
fait correspondre la somme des nombres associés à ces éléments. D’une 
façon analogue, l’égalité f(x) = af(x) veut dire qu’au produit de l’élé- 
ment f par à la fonction x fait correspondre le produit de æ par le nombre 
associé à f. Ainsi donc, x peut être interprété comme un élément de ,**. 

Démontrons que l’espace /, tout entier peut être identifié à un sous- 
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espace de ,**. Il suffit pour cela de démontrer que la somme et le produit 
par un nombre des vecteurs de , se confondent avec la somme et le pro- 
duit par un nombre de ces vecteurs interprétés comme fonctions linéaires 
sur /,*. Or, ce fait est évident. Pour la somme par exemple, ceci est équi- 
valent à la condition f(x + y) = f(x) + f(y) qui est satisfaite pour tous x, y 
de /, et tout f de /,*. 

La coïncidence de /, et de /,** découle maintenant de l’égalité de leurs 
dimensions, en vertu de la proposition 2 du $ 2, ch. VI. 

La proposition 4 signifie en fait qu’entre /, et /,** il existe un isomor- 
phisme canonique, indépendant du choix de la base. 

4. Fonctions linéaires sur un espace euclidien. Le choix d’une base dans 
l’espace vectoriel / établit un isomorphisme entre / et” *. Si l’espace 
est euclidien, l’isomorphisme entre / et son dual / * peut être établi cano- 
niquement sans tenir compte de la base. Dans l'exemple 2 on a montré pré- 
cisément que la formule f(x) = (a, x) permet de faire correspondre à cha- 
que vecteur a de l’espace euclidien une fonction linéaire f définie sur cet 
espace. 

Appelons le vecteur a vecteur associé à la fonction f(x) = (a, x) et cher- 
chons une relation entre la matrice-lignex des coefficients de cette fonction 
et la colonne de coordonnées du vecteur a dans une base e. On a f(x) = 
= XE = ‘alt ,où ae et £ sont les colonnes de coordonnées des vecteurs a et 
x, et l'est la matrice de Gram de la base e. Les coefficients de la fonction 
linéaire étant définis univoquement (ce sont ses valeurs sur les vecteurs de 
base), la dernière égalité entraîne 


x = ar, ou ‘x =Taæ. 
Cette dernière formule peut être interprétée comme expression analytique 
de l’application linéaireT : 4, — €°* par rapport aux basese etp, la basep 
étant la base duale dee. Vu que det F + 0, l’application F est un isomor- 
phisme de , sur “,*, les deux espaces étant considérés comme espaces vec- 
toriels. 

Il en découle, en particulier, que pour toute fonction linéaire f sur #, il 
existe un vecteur associé f tel que f(x) = (J, x). 

On’ n’a pas encore muni l’espace “,* de la multiplication scalaire. Mais 
on peut le faire à l’aide de la formule Œ(a), F(b)) = (a, b). Ceci étant, 
l'application F devient un isomorphisme entre espaces euclidiens. 

Ainsi donc, il existe entre l’espace euclidien <, et son dual un isomor- 
phisme bien défini, lié au produit scalaire, qui permet d’identifier ces espa- 
ces. Cette identification est courante. 


Considérons les vecteurs p' = F'(p')}(i = 1, …, n) identifiés avec les éléments de la 
base p. Il ressort de la formule (5) qu'ils satisfont à la condition 


; 0, +), 
ie.) = 
sd 1 h Ü = j. 
15— 6442 
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On en déduit sans difficulté que pour #7 = 3 la base biorthogonale définie au $ 3 du ch. 1 
coïncide avec la base duale définie à la p. 224. 


$ 2. Formes quadratiques 


1. Formes bilineaires.. DÉFINITION. On appelle fonction bilinéaire ou forme 


bilinéaire sur un espace vectoriel , la fonction b de deux vecteurs de /, 
vérifiant (pour tous vecteurs x, y ef z et tout nombre æ) les égalités 


b(x + y,2) = b(x,z) + bOy,27),  b(ax, y) = peer G) 
b(x, y + z) = b(x, y) + b(x,z), b(x, ay) = ab(x, y). 


Choisissons dans l’espace une base le,, …, e,l. Six = Ÿ £'e;et 
= 2, 7e;, la valeur de la forme bilinéaire b sur les vecteurs x et y peut 
être calculée de la façon suivante : 


b(x, y) 7 b(S £'e,, y ne) n D Em b(e;, e;), 
ia) j=i i,J 


ou en définitive :: 


b(x, y) = Y BE. (2) 

â, j 
Les n° nombres B., valeurs de la forme bilinéaire sur tous les couples de 
vecteurs de base, s’appellent coefficients de la forme bilinéaire dans la base 


le,, ..…, e 1. On les écrit habituellement sous forme de matrice carrée 
d'ordre n : 


Bi Bi Bin 
B B; B2 Br 
TT | 
Bei Bi ds Bron! 


Cette matrice est appelée matrice de la forme bilinéaire par rapport à la 
base donnée. On vérifie sans difficulté par multiplication des matrices 
qu’en représentation matricielle l’égalité (2) s'écrit sous la forme 


b(x, y) = '£Bz. (3) 


Avec le changement de base, la matrice associée à la forme bilinéaire 
varie évidemment. Cherchons la loi de cette variation. Supposons que les 
vecteurs e,, .…, e, de la nouvelle base s'expriment en fonction des vecteurs 
e,, .…, e, de l’ancienne base par les égalités e;” = }, ofe,, où of désignent 
les éléments de la matrice de passage S. Les coefficients de la forme bili- 
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néaire b dans la base e” vérifient pour tous à, j = 1, ..….,n 


bee) = DS de, À de)= Z débte a 
k,1 


K=1 l=] 


ou 
= Ÿ of ou. (4) 


k. 1 


Il est aisé de vérifier que l’égalité (4) est équivalente à l’égalité matricielle 
B° = 'SBS, (S) 


où Best la matrice de la forme bilinéaire par rapport à la base e’. 
La forme bilinéaire b est dite symétrique si pour tous x et y on a l'égalité 


b(x, y) = DO, x). 

Si la forme bilinéaire est symétrique, on a D(e.,e.) = b(e,, e;) pour tous 
i et j et, partant, la matrice associée à la forme bilinéaire & est symétrique. 
Inversement, supposons que la matrice de la forme bilinéaire est symétri- 
que, c’est-à-dire que B = ‘B. Alors, vu que la matrice dé type (1, 1) ne varie 
pas par transposition, On a 


b(x, y) = ‘('EBz) = ‘g'BE = '#BE = D(, x), 


et, par suite, la forme bilinéaire D est symétrique. On a ainsi démontré la 
proposition suivante : 


PROPOSITION 1. Une forme bilinéaire est symétrique si et seulement si sa 
matrice est symétrique (quelle que soit la base). 


2. Autre aspect de la forme bilinéaire. Considérons une forme bilinéaire b(x, y ) définie 
sur l’espace vectoriel /, et fixons un vecteur quelconque y de /,. b(x, y) est alors une fonc- 
tion linéaire de x. Pour le souligner, on peut désigner b(x, y) par b, (x). Ainsi, à chaque vec- 
teur y de n EE associée une fonction linéaire sur /, autrement dit on a une application 
B :_, — _”*. On voit aisément que l'application B est | linéaire. En effet, considérons l'image 
B(x + y) d' la somme de deux vecteurs x et y. C’est une fonction linéaire b, y Qui fait corres- 
pondre à tout vecteur z le nombre b(z, x + y). La fonction b étant linéaire par rapport au 
deuxième argument, on a b(z,x + y) = b(z, x) + b(z, y). D'où Dis, = b, + b,. Donc, 
B(x + y) = B(x) + B(y). De façon analogue on démontre que B(ax) = aB(x). 

Inversement, soit donnée une application linéaire B : , — +,° qui fait correspondre à 
tout vecteur y de , une fonction linéaire b, de ”,*. Donc, à tout couple de vecteurs x et y de 
7, On peut faire correspondre un nombre D, (x) qu ‘on est en droit de noter b(x, y). La fonc- 
tion b(x, y ) est linéaire par rapport au premier argument, vu que b, est une fonction linéaire; 
elle est aussi linéaire par rapport au deuxième argument, vu que B cs une application linéaire. 

Ainsi donc, la forme bilinéaire sur -, peut être définie comme une application linéaire de 
7, dans ,°. 

Soit e une base dans / etp la base duale dans / *. Cherchons la matrice de l'application 
linéaire B correspondant à la forme bilinéaire b. L'image B(e,) du vecteur de base e, est la 
fonction linéaire b. (x). Ses coefficients sont b(e,,e,), …, b(e,. e,). Les mêmes nombres for- 


15° 
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ment la i-ième colonne de la matrice cherchée, vu que ce sont les coordonnées de B(e.) par rap- 
port à la base p. On constate que la matrice de l’application B par rapport aux bases e et p 
coïncide avec la matrice B de la forme bilinéaire b par rapport à la base e. 

11 découle de ce qui vient d'être dit que la loi de variation de la matrice associée à la forme 
bilinéaire (5) est un simple corollaire de la formule (6) du $ 3, ch. VI (transformation de ia 
matrice d’une application linéaire) et de l'égalité (8) du $ 1. 

Le théorème 2 du $ 3, ch. VI, ne se rapporte pas aux formes bilinéaires car les bases e et p 
doivent être biorthogonales et ne peuvent donc être choisies de façon arbitraire. 

Si la forme bilinéaire n'est pas symétrique, en fixant le premier argument au lieu du 
second on obtient une autre application ‘B : / — _/*. Sa matrice par rapport aux bases bior- 
thogonales e et p est égale à la matrice transposée /B æ la forme bilinéaire. Nous proposons au 
lecteur de le vérifier à titre d'exercice. 


3. Formes quadratiques. On passe maintenant à l’étude d’une classe 
importante de fonctions définies sur un espace vectoriel, qui sont étroite- 
ment liées aux formes bilinéaires. 


DÉFINITION. On appelle forme quadratique la fonction k sur l’espace 
vectoriel # dont la valeur sur tout vecteur x est définie par l’égalité k(x) = 

= D(x, x) ou b est une forme bilinéaire symétrique sur #. 

La forme quadratique k définit de façon univoque la forme bilinéaire 
symétrique correspondante b. En effet, soient x et y des vecteurs quelcon- 
ques. Considérons la valeur de la forme quadratique sur le vecteur x + y 


k(x + y) = b(x + y, x + y) = b(x, x) + b(x, y) + by, x) + bO, >). 


La forme bilinéaire étant symétrique, on obtient 
| 
D(x, y) = 3 [K(x + y) — k(x) — KkC)], 


et, par suite, la valeur de b sur tout couple de vecteurs s’exprime en fonc- 
tion des valeurs de K. 

On appelle matrice de la forme quadratique k la matrice de la forme bi- 
linéaire symétrique correspondante b. 

Selon (2), la valeur k(x) de la forme quadratique k s’écrit au moyen des 
coordonnées du vecteur x par rapport à une base de la façon suivante : 


k(x) = Y BjEE (6) 

= 

ou sous forme matricielle | 
k(x) = '£EBE. (7) 


Le second membre de (6) est un polynôme homogène du second degré en 
£l, …, £". Son expression contient des termes semblables. A savoir, pour 
i À B; £'Y et B; . £i coïncident. Il en ressort qu'après la réduction des 
termes semblables, (6) prend la forme 


k(x) = 8, (EX + 28,,E'E7 + BE + 28, + … (8) 


ar: 
ty 
—— 
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THEOREME 1. Pour toute forme quadratique k il existe une base dans 
laquelle 


n 
k(x) = Y 6,6’), (9) 
tm 
c'est-à-dire que la matrice associée à la forme quadratique est diagonale. 
La relation (9) est appelée décomposition en carrés de la forme quadra- 
tique. 


DÉMONSTRATION. Considérons une forme quadratique k et notons B sa 
matrice par rapport à une base de départ. On appliquera à la matrice B une 
suite de transformations élémentaires qu'on partagera, pour commodité de 
description, en étapes. A la première étape deux cas peuvent se présenter : 

1) Cas général : 6,, # 0. Si cette condition est remplie, retranchons la 
première ligne multipliée par des facteurs convenables (8,,/8,, pour la 
i-ième ligne) de toutes les lignes situées au-dessous d’elle. De façon analo- 
gue, retranchons la première colonne multipliée par les mêmes facteurs de 
toutes les colonnes situées à droite d'elle. Les facteurs sont choisis de 
maniére que la matrice B se transforme en matrice B, 


€, O … O0 


° (10) 
C, | 


) 


où C, est une matrice carrée symétrique d’ordre ñn — 1. 

2) Cas particulier : 6,, = 0. Deux possibilités apparaissent : a) 6,, = 0 
pour tous les i = 2, ..,n. La matrice est déjà de la forme (10). b) Il existe 
un i pour lequel B,, + 0. On effectue alors une transformation supplémen- 
taire : si 8. # 0, on permute la i-ième ligne avec la première, ainsi que la 
i-ième colonne avec la première. On a alors B,, = 8, # 0.MaissiB, = Oon 
ajoute la i-ième ligne à la première, et la i-ième colonne à la première. Dans 
la matrice transformée, B,, = 28,, + O0, de sorte qu’après une transforma- 
tion supplémentaire la matrice se réduit à la forme (10) comme dans le cas 
général. 

Supposons qu'après £ étapes on ait obtenu la matrice B, de la forme 


€; 
(11) 
O C, 


C, est ici une matrice symétrique d'ordre n — K,ete,, .…,e, sont les élé- 
ments supérieurs gauches des matrices C; obtenues aux étapes précédentes. 
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La (& + 1)-ième étape consiste dans l’application à la matrice B, des 
transformations élémentaires qui sont équivalentes aux transformations de 
la première étape appliquées à la matrice C,, et qui n’affectent pas les k 
premières lignes et les k premières colonnes de la matrice B, . On obtient en 
définitive la matrice B, , , qui est de même type que la matrice B,.. 

Après ñn — 1 étapes la matrice C,_, est d’ordre 1 et n’a plus besoin 
d’être transformée. En définitive, la matrice B se transforme en matrice 
diagonale 


n 


1 va de soi que si la matrice de départ ou l’une des matrices C, est nulle, 
les transformations suivantes deviennent inutiles, car la matrice est déjà 
diagonale. Cette situation est équivalente à la réalisation du cas particulier 
à toutes les étapes ultérieures. 

Il est important de signaler qu’après chaque transformation élémentaire 
des lignes on a effectué la même transformation des colonnes. Si la trans- 
formation élémentaire des colonnes de la matrice B est équivalente à la 
multiplication à droite de la matrice B par la matrice S._ (comp. point 4, $ 6, 
ch. V), la même transformation des lignes est équivalente à la multiplica- 
tion à gauche de la matrice B par la matrice 'S. 

A la suite de toutes ces transformations élémentaires on obtient la 
matrice B° = 'SBS,oùS = S,...S,, est le produit de toutes les matrices cor- 
respondant aux transformations des colonnes. 

On a ainsi démontré que la matrice B ” est la matrice de la forme qua- 
dratique Kk par rapport à la base e” qui est liée à la base de départ e par la 
matrice de passage S. Le théorème est démontre. 

Pour décomposer la forme quadratique en carrés on peut se servir de la 
méthode de Lagrange. Montrons-le sur un exemple. Soit une forme qua- 
dratique de type (8) 


k(x) = 2!) + 4ElE? + 38°) + 4E*E + 5(E*). 
Le coefficient de (£!)° étant différent de zéro, groupons tous les termes 
contenant £! : 


2)? + 2£!E2] + 3(E°)? + AE?ES + 5(£*):. 


Complétons maintenant l’expression entre crochets pour avoir le carré de 
la somme. A cet effet, ajoutons et retranchons 2(£?})° : 


2)? + 26 'E2 + (E2)°] — 22) + 3(E°) + AETE + 5°). 
Maintenant on peut écrire la forme quadratique de la façon suivante : 
k(x) = 2! + E°) + Kk' (x), 
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où k° est une forme quadratique dont la valeur ne dépend que de £* et £* : 
kK' (x) = (2) + AETET + S(E°Y. 
On peut y appliquer le même procédé : 
k'Gx) = (&° + 26°) + (E°Y°. 
Maintenant k(x) prend la forme de 
21) + EE) + E°Y, 


où EI e2 È2 — #2 4 9+53 53 3 
ETES, £* = EE" + En CR 


Les dernières formules définissent la transformation des coordonnées d’un 
vecteur lorsqu'on passe à la base dans laquelle la forme quadratique se 
décompose en carrés. 

Dans la démonstration du théorème 1, on a proposé une suite détermi- 
née de transformations élémentaires pour réduire la forme quadratique à la 
somme des carrés. La méthode de Lagrange ne diffère du procédé proposé 
que par la forme d'écriture. Il est utile de savoir que pour réduire une 
matrice à la forme diagonale, on peut utiliser toute autre suite de transfor- 
mations élémentaires, mais à une seule condition importante : après cha- 
que transformation élémentaire des lignes il faut procéder à la même trans- 
formation élémentaire des colonnes. 

La décomposition en carrés de la forme quadratique dans un espace réel 
sera appelée forme canonique si les nombres €, ne peuvent prendre que les 
valeurs 1, — 1 et 0. Dans un espace complexe, la décomposition en carrés de 
la forme quadratique est canonique si €£, ne sont égaux qu’à 1 ou O. 


THÉORÈME 2. Pour toute forme quadratique il existe une base par rap- 
port à laquelle elle est de la forme canonique. 


Pour le démontrer, décomposons d’abord la forme quadratique en car- 
rés, après quoi faisons la transformation suivante. Si l’un quelconque des 
éléments diagonaux €, est différent de zéro, multiplions le £-ième vecteur 
de base par (e,)7!’? ou par l£,1 -!’* selon que l’espace est complexe ou 
réel. On voit facilement que cela correspond à la multiplication de la 
k-ième ligne et de la k-ième colonne de la matrice de la forme quadratique 
par le même facteur. En le faisant pour tous les 4 tels que £, # 0, on réduit 
la forme quadratique à sa forme canonique. 

4. Rang et indice de la forme quadratique. Il existe plusieurs bases dans 
lesquelles la forme quadratique donnée prend une forme canonique. Pour 
chacune de ces bases, les coefficients €, auraient dû en général être diffé- 
rents. Or il s’avère justement qu’ils sont les mêmes (à l’ordre près), quel 
que soit le procédé appliqué pour réduire la forme quadratique à sa forme 
canonique. 

Commençons par la proposition auxiliaire importante suivante. 
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PROPOSITION 2. Si det À # 0 et les produits AB et CA sont définis, on a 
Rg AB = RgBet Reg CA = RC. 


En effet, selon la proposition 5 du $ 6, ch. V, on a simultanément 
Rg B = Rg A-!(4B)< Reg AB et Rg AB < R£g B, d’où Rg B = Rg AB. 
La proposition se démontre de façon analogue si le facteur À est à droite. 


THÉORÈME 3. Le rang de la matrice associée à la forme quadratique est 
indépendant de la base. 


En effet, selon la formule (5), les matrices K et K ” de la forme quadrati- 
que K rapportée aux bases e et e” sont liées par l’égalité K° = 'SXS, où 
det S + 0. D'où en vertu de la proposition 2, Rg K °° = Rg KS = Reg K.Si 
la forme quadratique est de la forme canonique, le rang de sa matrice est 
égal au nombre des coefficients €; différents de zéro. Or, ce nombre ne dé- 
pend pas de la base. 


DÉFINITION. On appelle rang de la forme quadratique k le nombre des 
coefficients €; non nuls de sa forme canonique. 

On a vu que le rang de k est égal au rang de sa matrice dans une base 
quelconque. 


Signalons que la représentation « géométrique » du rang de la forme quadratique peut 
être obtenuc en interprétant la forme bilinéaire symétrique correspondante comme une appli- 
cation 7 — 7 *. 


Dans un espace complexe, toutes les formes quadratiques d’un même 
rang r se réduisent (chacune dans sa base) à la même forme canonique 
(EX + … + (ET. 


Considérons maintenant la forme quadratique k sur l’espace réel Æ#. 


DÉFINITION. On dit que la forme quadratique k est définie positive sur le 
sous-espace /‘ de l’espace _/ si k(x) > 0 pour tout vecteur x non nul de 
". D'une façon analogue, Kk est définie négative sur / " si k(x) < 0 pour 
tout x non nul de _” :. 

Si k(x) > O ou k(x) < 0 pour tout x # 0 de , on dit que k est respec- 
tivement une forme quadratique définie positive ou une forme quadratique 
définie négative. 

Les formes quadratiques qui pour tout x vérifient les inégalités k(x) > 
> Oouk(x) < 0 sont dites respectivement semi-définies positives ou néga- 
lives. 

Il est commode de poser que sur le sous-espace nul, toute forme qua- 
dratique est à la fois définie positive et négative. En vertu de cette conven- 
tion il existe toujours un sous-espace (au moins nul) sur lequel la forme 
quadratique est définie négative, et l’on est en mesure de choisir entre ces 
sous-espaces celui qui est de dimension maximale. 
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DÉFINITION. Soit /(-) un sous-espace de dimension maximale parmi 
tous les sous-espaces sur lesquels la forme quadratique k est définie néga- 
tive. La dimension de _/() est appelée indice négatif de la forme quadrati- 
que Kk. 


THÉORÈME 4 (loi d'inertie des formes quadratiques). Etant donné la 
forme quadratique K, le nombre des coefficients &. négatifs (positifs) de la 
Jorme canonique ne dépend pas du choix de la base dans laquelle elle est 
réduite à la forme canonique. 


On démontrera une affirmation équivalente : si dans une base quelcon- 
que la forme quadratique Kk est réduite à la forme canonique, le nombre des 
coefficients négatifs coïncide avec l’indice négatif de k. Etant donné que le 
nombre total des coefficients positifs et négatifs est égal au rang, il ressort 
de la proposition précédente que le nombre des coefficients positifs est 
aussi indépendant de la base. 

En effet, supposons que dans la base le, , .…, €, À la forme quadratique 
d'indice négatif s est de la forme canonique 


ER = = EP + GP + + EP. 
Désignons par _/ l’enveloppe linéaire des vecteurs e,, …, e; et par —, celle 


des vecteurs e,,,,.…., e,. Pour un vecteur x de _Æona#*t! =... =E£"- 
= 0, de sorte que k(x) = —(£!} — ….. — (MY < Osix + 0. Donc, la 
forme k est définie négative sur le sous-espace _“ de dimension j, ets > j. 

Admettons maintenant ques > j et qu’il existe un sous-espace _/(-) de 
dimension s sur lequel k est définie négative. Les composantes de tout vec- 
teur x de _/, vérifient les égalités £! = . = £/ = O0 et, par suite k(x) > 0 
pour tout x de /,. La dimension de _S est nr — j, et la somme des dimen- 
sions de /, et de (7) est strictement supérieure à n. Selon le théorème 1 
du $ 2, ch. VI, / et (7) ont une intersection non nulle. Pour un vecteur z 
non nul de /, MN (7) on aurait dû avoir simultanément k(z) < 0 et 
k(z) > 0. Il découle de la contradiction obtenue que s = j. Le théorème est 
démontré. 

Les formes quadratiques définies positives sont de rang n# et d’indice 
négatif 0 et se réduisent à la forme canonique 


CS SE LE (12) 


Les formes quadratiques définies négatives sont de rang n et d’indice néga- 
tif n. Elles se réduisent à la forme 


nt D VE 


Les formes semi-définies positives et négatives de rang 7 se réduisent res- 
pectivement aux formes canoniques suivantes : 


GP +. +R —ŒP EX. 
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On a vu qu’à toute forme quadratique sur un espace réel on peut asso- 
cier deux nombres : son rang et son indice négatif. Ces deux nombres la 
caractérisent au sens que toutes les formes quadratiques ayant même rang 
et même indice négatif se réduisent (chacune dans sa base) à la même forme 
canonique. Au lieu du rang et de l’indice négatif, la forme quadratique 
peut être caractérisée par tout autre couple de grandeurs permettant de 
trouver ces nombres. Par exemple, au lieu du rang on se donne souvent 
l'indice positif qui est égal au nombre des coefficients positifs dans la 
forme canonique. Avec l’indice négatif, nombre des coefficients négatifs, il 
caractérise la forme quadratique. Dans le $ 2 du ch. IX on caractérisera la 
forme quadratique par le rang et par la différence des indices positif et 
négatif, appelée signature de la forme quadratique. 

Il est utile de savoir déterminer si la forme quadratique donnée est défi- 
nie positive, et cela sans la rendre canonique. On peut le faire en se servant 
du théorème suivant appelé loi de Sylvester. 


THÉORÈME S. Pour qu'une forme quadratique soit définie positive, il 
faut et il suffit que les mineurs de sa matrice vérifient les inégalités 


Bin + BP 
PR > 0 (13) 


pour tous Kk = 1, ..….,n. 

Les mineurs de la forme (13) sont appelés mineurs principaux de la 
matrice. 

Pour le démontrer, reprenons les transformations de la matrice associée 
à la forme quadratique, qui ont été utilisées dans la démonstration du théo- 
rème !. 

1° La condition est nécessaire. Si la forme. quadratique k est définie 
positive, les éléments diagonaux de sa matrice par rapport à toute base 
satisfont à la condition 


B; = k(e,) > O, 


et, par suite, en réduisant la matrice à la forme diagonale on ne se heurte 
pas au cas particulier. Dans le cas général, à toute ligne on ne peut ajouter 
que la ligne située au-dessus d’elle et à toute colonne, que la colonne située 
à gauche d’elle. Les mineurs principaux de la matrice ne varient pas par ces 
transformations. Or les mineurs principaux de la matrice diagonale asso- 
ciée à la forme quadratique définie positive sont positifs. Par suite, les 
mineurs principaux de la matrice initiale sont aussi positifs. 

2° La condition est suffisante. Supposons que tous les mineurs princi- 
paux de la matrice B sont positifs. En particulier, M, = B,, > 0, et les 
transformations de la première étape conduisent la matrice à la forme (10) 
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avec €, > 0. Admettons qu'après £ étapes on obtient la matrice B, avec 
Ej, -, €, Strictement positifs, sans qu’apparaisse le cas particulier. Alors 
pour l’élément supérieur gauche de la matrice C,onaëc,,, = M,,,/M, 
car les mineurs principaux n’ont pas varié. Il s’ensuit que €,,, > 0. A 
l’étape suivante des transformations on a le cas général, et la matrice obte- 
nue B,,, contient les éléments €,, .…, €,,, strictement positifs. En procé- 
dant à ce raisonnement pour tous les £ de 2 à n, on finit par démontrer le 
théorème. 


$S 3. Formes quadratiques et produit scalaire 


Si dans un espace vectoriel réel est défini le produit scalaire (autrement 
dit l’espace est euclidien), on peut à chaque forme bilinéaire, indépendam- 
ment du choix de la base, faire correspondre une transformation linéaire. 


DEFINITION. La transformation linéaire À de l’espace euclidien <, est 
dite associée à la forme bilinéaire b si pour tous vecteurs x et y de “, est 
vérifiée l’égalité 

b(x, y) = (x, AG). (1) 

PROPOSITION 1. Pour toute forme bilinéaire il existe une transformation 

associée et une seule. 


Pour le démontrer, admettons d’abord que la transformation associée 
existe pour b. Notons B et À les matrices de b et de À par rapport à une 
base e et écrivons l’égalité (1) sous forme matricielle : 


E Be = 'ET A, 


où l'est la matrice de Gram de la base e. On peut donner à la dernière éga- 
lité la forme 'E(B — A) = 0. 

Supposons que les vecteurs arbitraires x et y sont égaux aux vecteurs de 
base e, et e;. Alors leurs colonnes de coordonnées £ et æ sont respective- 
ment égales à la ;-ième et à la j-ième colonne de la matrice unité. Il s’ensuit 
que l’élément de la ;-ième ligne et de la j-ième colonne de la matrice B — 
— TA est nul (comp. exemple 4, p. 160). Etant donné que i et j sont arbi- 
traires, on voit que B — l'A = O. On peut donc exprimer la matrice 4 au 
moyen de la matrice B : 


A =T"!B. (2) 


Cela signifie que la forme bilinéaire ne peut avoir plus d’une transforma- 
tion associée : si elle existe, sa matrice est F-!B. 

On démontre maintenant sans difficulté l’existence de la transforma- 
tion associée. Il suffit pour cela de vérifier que la transformation de 
matrice (2) est la transformation associée. En effet, il ressort de (2) que 
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B = TA et, par suite, pour toutes matrices-colonnes £ et #æ on a 
IEByæ = '£T Az. L'égalité (1) est donc vérifiée par tous vecteurs x et y de 
6. La proposition est démontrée. 

Signalons que dans le cas d’une base orthonormée, la relation entre les 
matrices de la forme bilinéaire et de la transformation associée est particu- 
lièrement simple: 


B = A. 
Ce résultat et la proposition 2 du $ 2, ch. VI, entraînent la 


PROPOSITION 2. La transformation associée à une forme bilinéaire est 
symétrique si et seulement si cette forme est symétrique. 


Si la transformation linéaire est associée à une forme bilinéaire symétri- 
que b, on dit qu’elle est aussi associée à la forme quadratique définie par b. 
Ainsi, à chaque forme quadratique est associée une transformation symé- 
trique. 

Le lien étroit entre les formes quadratiques et les transformations symé- 
triques permet de démontrer le théorème important suivant. 


THÉORÈME 1. Dans un espace euclidien, il existe pour chaque forme qua- 
dratique une base orthonormée par rapport à laquelle elle se décompose en 
carrés. 


Le théorème est presque évident : la base dont on affirme l’existence est 
une base orthonormée constituée des vecteurs propres de la transformation 
linéaire associée à la forme quadratique. Dans cette base on a B = À et À 
est une matrice diagonale. 


THÉORÈME 2. L'espace euclidien peut être défini comme un espace vecto- 
riel réel muni d’une forme quadratique définie positive. 


En effet, faisons correspondre à chaque vecteur de l’espace euclidien 
son carré scalaire. On obtient une fonction définie par K(x) = (x, x). Sir 
est la matrice de Gram d’une base de € et £& la colonne de coordonnées 
d’un vecteur x dans cette base, la fonction k se définit par la formule 
k(x) = 'ETE. C’est donc une forme quadratique. En vertu de l’axiome 4° 
de l’espace euclidien, k(x) > 0 pour x # 0, de sorte que la forme k est défi- 
nie positive. 

Inversement, soit dans l’espace vectoriel réel _# une forme quadratique 
définie positive k. Elle permet de définir une forme bilinéaire symétrique b 
et une seule. Introduisons dans # le produit scalaire en posant (x, y) = 
= b(x, y). Les axiomes 2° et 3° sont vérifiés car b est une forme bilinéaire. 
L’axiome 1° se vérifie vu que b est symétrique. La forme k étant définie 
positive, l’axiome 4° est vérifié. Le théorème est démontré. 

Notons que (x, >) s'exprime dans la base e par l'égalité (x, y) = '£K®%, 
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où ‘£ et æ sont les colonnes de coordonnées des vecteurs x et y, et K la 
matrice de la forme quadratique. K est donc la matrice de Gram de la base 
e. Il ressort de la démonstration du théorème 2 que la forme quadratique 
doit être définie positive pour que soit vérifié l’axiome 4°. 

On étudie aussi des espaces dans lesquels le-produit scalaire est défini à 
l’aide d’une forme quadratique quelconque. Dans ces espaces, il existe des 
vecteurs dont le carré scalaire est négatif, ce qui rend la géométrie profon- 
dément différente de l’euclidienne. Si le produit scalaire est défini par une 
forme quadratique de rang égal à la dimension de l’espace, on dit que c’est 
un espace pseudo-euclidien. Parmi les espaces pseudo-euclidiens, un rôle 
important en physique mathématique est joué par l’espace à quatre dimen- 
sions, dans lequel est définie la forme quadratique —(£!} — (£2} — 
— (EX + (EX. C’est l’espace dit de Minkowski. 

Utilisons le théorème 2 pour démontrer le théorème suivant. 


THÉORÈME 3. Soient dans un espace vectoriel /, deux formes quadrati- 
ques k et h, dont h est définie positive..Il existe alors dans 4 une base par 
rapport à laquelle les deux formes se décomposent en carrés (la forme h 
étant d’ailleurs de la forme canonique). 


Pour le démontrer, introduisons dans # le produit scalaire à l’aide de 
la forme définie positive h. Toute base dans laquelle h est de la forme (12) 
du $ 2 est une base orthonormée par rapport à ce produit scalaire, vu que sa 
matrice de Gram est une matrice unité. Selon le théorème 1 il existe pour la 
forme k une base orthonormée dans laquelle elle se décompose en carrés. 
C’est justement la base dont on démontre l’existence. 

REMARQUE. Si # est euclidien, le théorème 3 demeure évidemment vrai. 
On s’abstrait du produit scalaire défini auparavant et on introduit un nou- 
veau produit scalaire par l’intermédiaire de la forme h. 

La base dans laquelle k et h se décomposent en carrés ne sera pas, dans 
le cas général, orthonormée par rapport à l’ancien produit scalaire. 

En pratique, pour décomposer en carrés les deux formes quadratiques, 
on construit d’abord une base dans laquelle h se décompose en carrés et 
l’on recherche la matrice K ° de la forme k dans cette base. On passe ainsi à 
une base orthonormée par rapport au produit scalaire auxiliaire introduit 
lors de la démonstration du théorème. La transformation linéaire dont la 
matrice par rapport à la base trouvée est aussi K”, est la transformation 
associée à la forme k. Il faut rechercher les vecteurs propres de cette trans- 
formation, les orthogonaliser et les normer en calculant le produit scalaire 
suivant la formule (11) du $ 1, ch. VII. On obtient ainsi la base des vecteurs 
propres, orthonormés par rapport au produit scalaire auxiliaire. C’est jus- 
tement la base recherchée. La matrice de la forme h y est une matrice unité 
et la matrice X ”” de la forme k est diagonale, ses éléments diagonaux étant 
égaux aux racines du polynôme caractéristique de la matrice K”°. 
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La décomposition en carrés des deux formes quadratiques peut aussi 
être réalisée d’une autre façon. Soient K et H les matrices des formes qua- 
dratiques dans la base initiale e. Comme il a été signalé dans la démonstra- 
tion du théorème 2, H est la matrice de Gram de la base e pour le produit 
scalaire auxiliaire. La matrice 4 = H=1K est la matrice de la transforma- 
tion linéaire associée à la forme k. L’équation caractéristique de la trans- 
formation est de la forme det (H-!K — ÀE) = 0. VuqueH-!K — XE = 
= H='(K — XH)et det H-! # 0, l'équation caractéristique possède les 
mêmes racines que l'équation 


det (Æ — AH) = OC. (3) 


Pour chacune de ces racines, le système d’équations linéaires (H-!K — 
— ÀE)E = o servant à la recherche des vecteurs propres est équivalent au 
système 


(X — AH) = 0. 


Pour chaque , le système fondamental des solutions d’un tel système doit 
être orthogonalisé et normé à l’aide du produit scalaire défini par la for- 
mule (13) du $ 1, ch. VII, avec matrice de Gram FH. On construit ainsi la 
base €. Vu qu’elle est orthonormée par rapport au produit scalaire auxi- 
liaire, la matrice de h dans la base & est une matrice unité. Cette base étant 
composée des vecteurs propres de la transformation associée à la forme k, 
la matrice de k dans é& est une matrice diagonale avec racines de l'équation 
(5) sur la diagonale. 


$ 4. Formes hermitiennes 


Les formes quadratiques définies sur les espaces unitaires ne vérifient 
ras les théorèmes du $ 3. Ces théorèmes sont pourtant valables pour 
d’autres fonctions appelées formes hermitiennes. Limitons-nous aux énon- 
cés de ces théorèmes car les démonstrations ne diffèrent presque pas de cel- 
les des théorèmes correspondants du $ 3. 

La fonction b de deux vecteurs, définie sur un espace vectoriel com- 
plexe _# est appelée forme bilinéaire hermitienne ou forme sesquilinéaire si 
pour tous vecteurs x, } et z et tout nombre complexe a sont vérifiées les 
égelités 

b(x + y,2) 
D(x, y + 7) 


D(x, y) + bOy, 2), bD(ax, y) 
D(x, y) + b(x, z),  b(x, ay) 


ab(x, y.), 
ab(x, y). 


Cette définition diffère de celle de la forme.bilinéaire par le fait que si l’on 
multiplie le second argument par le nombre «, on doit multiplier la valeur 
de la forme bilinéaire hermitienne par le conjugué complexe «. 
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Si l’on a choisi une base dans ,, la valeur de b sur le couple de vec- 
teurs (x, y) peut être écrite sous la forme 


b(x, y) = Ÿ Btim, ou b(x, y) ='EBs, 


1.) 


où £ et æ sont les colonnes de coordonnées des vecteurs x et y. La matrice 
B = 18. est appelée matrice de la forme bilinéaire hermitienne. 
Lorsqu’on change de base, elle se transforme suivant la loi 'SBS. 

La forme bilinéaire hermitienne est dite symétrique si b(x, y) = 
= b(y, x). Cette condition est équivalente au fait que sa matrice est hermi- 
tienne. 

La fonction k sur _/ s’appelle forme quadratique hermitienne ou tout 
simplement forme hermitienne si k(x) = b(x, x) pour une forme bilinéaire 
hermitienne symétrique b. La forme b se définit univoquement par k. 

Considérons une forme hermitienne k sur l’espace unitaire Z,. La 
transformation linéaire À dans % est dite associée à la forme k si elle est 
auto-adjointe et k(x) = (x, A(x)) pour tous les x. Dans une base orthonor- 
mée, la matrice de la transformation À coïncide avec la matrice conjuguée 
de la matrice de k. Il s’ensuit que pour toute forme hermitienne k il existe 
une base orthonormée dans laquelle sa matrice est diagonale avec éléments 
diagonaux réels. En allongeant les vecteurs de base, on peut réduire la 
forme hermitienne à sa forme canonique, de sorte que les éléments diago- 
naux de la matrice associée deviennent égaux à 1, — 1 ou 0. Les formes her- 
mitiennes vérifient la loi d'inertie. 

L'espace unitaire peut être défini comme un espace vectoriel complexe 
muni d’une forme hermitienne définie positive. 

Pour un couple de formes hermitiennes dont l’une est définie positive 
on peut trouver une base dans laquelle elles se décomposent, toutes deux, 
en carrés. 


CHAPITRE IX 


ESPACES AFFINES 


$ 1. Plans 


1. Espace affine. Dans le chapitre 1, on a admis que la notion d’espace 
géométrique ordinaire était familière au lecteur à partir de l’école secon- 
daire et on a défini le vecteur comme un couple ordonné de points. Dans les 
chapitres VI à VIII, on a bâti la théorie des espaces vectoriels multidimen- 
sionnels. En partant de cette dernière, on est en mesure maintenant de 
fournir une définition axiomatique de l’espace ponctuel de dimension quel- 
conque. 

Considérons un espace vectoriel réel / de dimension n et introduisons 
la définition suivante. 


DÉFINITION. On dit que l’ensemble . / est l’espace affine de dimension n 
et ses éléments points s’il existe une relation qui à chaque couple ordonné 
Ge ses éléments À, B fait correspondre un vecteur de et un seul (qu’on 
notera AB) tel que : 

1° Pour tout point À de.” et tout vecteur x de Z il existe un point B et 
un seul tel que AB = x. Ce point sera noté P(A, x). 

2° Pour tout triplet de points 4, B et C est vérifiée l’égalité AB + 
+ BC = AC 

On dira que _Z est l’espace de vecteurs associé à l’espace. , et ses élé- 
ments, les vecteurs dans .”. 

Pour établir une correspondance avec les définitions du $ 1, ch. I, 
remarquons que le premier axiome exprime la possibilité de construire un 
vecteur quelconque à partir d’un point arbitraire ; quant au second 
axiome, il répond à la définition de la somme des vecteurs. 

Voici les plus simples corollaires : 

a) Pour tout couple de points, AA + AB = AB. Il s’ensuit que le vec- 
teur associé à un couple de points confondus est ne Pour tout point À on 
a P(A, o) = À, car P(A, o) = P(A, AÀ) = 

._ b) L’axiome 2° donne pour les points 4, B, : la relation AB + EÀ = 

= AÂ, d'où AB = —BÀ. 

c) Laissons au lecteur le soin de démontrer que pour quatre points A, B, 
A'et B’, l'égalité AB = AB" est vérifiée si et seulement si AA‘ = BB:. 


Cette propriété s’identifie à la définition de l’égalité des vecteurs, intro- 
duite au $ 1, ch. I. 

L’espace vectoriel # permet de construire un espace affine. En effet, 
soit .” un ensemble de vecteurs dans l’espace Æ. Associons à chaque cou- 
ple de vecteurs x et y le vecteur xÿy = y — x. On s’assure sans difficulté que 
les axiomes 1° et 2° se vérifient dans ce cas. Intuitivement cette construc- 
tion nous suggère la représentation suivante. Si on interprète les vecteurs de 
_, comme des segments orientés issus d’un même point, les extrémités de 
ces vecteurs sont des points de l’espace .”. 


DÉFINITION. Les espaces affines .# et." sont dits isomorphes s’il existe une Rp 
bijective f:S, — .#" et un isomorphisme entre | eurs espaces de vecteurs F : 7 — 7" tels 
que pour tous points À et B de." on a l'égalité (A )f(B) = F(4B). 

Il ressort immédiatement de la définition que ne peuvent être isomorphes que des espaces 
de même dimension. 

Si pour un point À on connaît son image f(4) par l'isomorphisme f et que soit donné 
l’isomorphisme F, l'application f est définie de façon univoque. En effet, l'image de tout 
autre point B peut être obtenue par la formule {(B) = P(f(A), F(AB)). D'autre part, quels 
que soient f(A) et F, on obtient nécessairement un isomorphisme f : 7 — 4". En effet, on 
vérifie aisément que f AM(B) = F(AB)et (AC) = F(AC) entraînent À BNC) - F(8C) 
pour tous points B et C. Il en découle la 


PROPOSITION 1. Deux espaces affines de même dimension sont isomorphes. L'isomor- 
phisme est défi ni univoquement si sont donnés l'image d'un des points et l'isomorphisme 
rie 22 

Dans l Aude de chaque classe d'espaces, un rôle particulier est assumé par les transfor- 
mations qui sont des isomorphismes appliquant ces espaces sur eux-mêmes. Pour les espaces 
vectoriels, ce sont des transformations linéaires bijectives ; pour les espaces euclidiens, des 
transformations orthogonales. Etudions les transformations isomorphes d’un espace affine. 

A cet effet, supposons d’abord que l’isomorphisme F : # — _# est une transformation 
identique. Soit f(A) l’image d’un point 4. Considérons une transformation définie par l'éga- 
lité f(B) = P(f(A), AB) quel que soit le point 8. Notons pour abréger (A) = 4°, f(B) = 
= B°.L égalité précédente devient 4° B° = AB. Or, elle est équivalente en vertu de c) à 
l'égalité BB = AA°. Ainsi, l’image de chaque point s'obtient par translation de ce point de 
vecteur 4A ° 

Si l’on pose que f(4) = À et F est une transformation linéaire bijective, on aboutit à une 
transformation de l’espace affine définie par la formule f(B) = P(A, F(4B)). Cette formule 
établit une correspondance biunivoque entre les transformations linéaires bijectives et les 
transformations isomorphes de l'espace affine laissant invariant le point À. 


On voit qu’il existe, entre les espaces affines et vectoriels, une diffé- 
rence essentielle consistant dans le fait que l’ensemble des transformations 
isomorphes des premiers est plus étendu parce que comprend des transla- 
tions. 


DÉFINITION. L’espace affine est appelé espace euclidien ponctuel si son 
espace des vecteurs est euclidien. 

Dans l’espace euclidien ponctuel, la longueur du vecteur 4B s’appelle 
distance entre les points À et B. 
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Un espace euclidien ponctuel tridimensionnel coïncide avec l’espace 
étudié en géométrie élémentaire si l’on y fixe l’unité de mesure. 

On appelle repère cartésien de l’espace affine .# un ensemble formé du 
point O et de la base e de l’espace de vecteurs _#. Si le repère {O, e] est 
donné, à chaque point À de l’espace ./ est associé de façon univoque un 
système ordonné de n nombres, à savoir, les composantes du vecteur OÀ 
dans la base e. Ces nombres sont appelés coordonnées cartésiennes du 
point À dans le repère {O, e}, et la matrice-colonne composée de ces nom- 
bres, colonne de coordonnées de À. Le point est défini de façon univoque 
par ses coordonnées si le repère est donné. Si £, et £, sont les colonnes de 
coordonnées des points À et B, la colonne des coordonnées du vecteur AB 
est £, — £,. On le démontre comme au $ 2 du ch. I. 

La loi de transformation des coordonnées d’un point dans un change- 
ment de repère se déduit comme pour l’espace tridimensionnel au $ 4 du 
ch. I. 

2. Plans dans l’espace affine. Soient donnés le point À, de l’espace 
affine . et le sous-espace _, de dimension Æ dans son espace de vecteurs 
+... L'ensemble de tous les points P(A,, x), où x appartient à 7, est 
appelé plan k-dimensionnel dans .” . Il est évident que le point 4, est aussi 
situé dans le plan. On l’appellera point initial, et le sous-espace _Z, sous- 
espace directeur. 

Tout point du plan.” peut être pris pour son point initial. En effet, soit 
À = P(4,, x) un point de. . Alors tout point B = P(A,, y) de . peut 
être représenté sous forme de B = P(4, y — x), car 4,B — À, A = AB, 
AB = yet À À = X, avec y — x appartenant à #. D’une façon analo- 
gue, pour chaque z de , on a P(A4, z) = P(A,, z + x) et, par suite, 
P(A, 2) appartient au plan. 

Il n’est pas difficile de démontrer que le plan de dimension & est un 
espace affine k-dimensionnel attaché à l’espace de vecteurs Z . 


PROPOSITION 2. Si on a choisi dans ./, un repère cartésien, les coordon- 
nées des points de tout plan k-dimensionnel vérifient le système d’équa- 
tions linéaires de rang n — k. Inversement, l’ensemble des points dont les 
coordonnées vérifient le système compatible d'équations linéaires de rang r 
est un plan (n — r)-dimensionnel. 


Pour le démontrer, désignons par &, et £ les matrices-colonnes des coor- 
données respectives du point initial À, et d’un point variable À du plan .”. 
Puisque le vecteur À À appartient à  , sa colonne de coordonnées £ — £, 
vérifie le système homogène d’équations de rang 7 — k (proposition 4, $ 2, 
ch. VI). Soit U la matrice de ce système. Alors U(E — £,) = 0 et £ vérifie le 
système d’équations linéaires UE + 8 = 0, où B = —UE,. 

La seconde partie de la proposition découle du théorème 2, $ 5, ch. V. 

La solution générale du système d’équations linéaires (formule 
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(14), 85, ch. V) nous fournit les équations paramétriques du plan 
(n — r)-dimensionnel dont les paramètres sont les coefficients de la combi- 
naison linéaire du système fondamental de solutions, quant au système 
fondamental il joue le rôle de base dans le sous-espace directeur. Le point 
initial du plan est une solution particulière du système non homogène. 

Le plan de dimension #7 — 1 est appelé hyperplan. Il est défini par 
l'équation @,£l + …. + a,£" + 6 = 0. 

Le plan unidimensionnel est appelé droite. Il est défini par le système 
d’équations de rang n — 1 ou par l’équation paramétrique £ = £, + tz 
dans laquelle £&, est la colonne de coordonnées du point initial et # la 
colonne de coordonnées d’un vecteur non nul du sous-espace directeur “. 

Etant donné un vecteur #, l’ensemble de points de la droite qui corres- 
pondent à des valeurs £ > {, est appelé demi-droite, et l’ensemble de points 
qui correspondent à {, < { < {,, segment. 


$ 2. Théorie générale des courbes et surfaces du deuxième ordre 


On revient dans ce paragraphe à la géométrie de l’espace ponctuel tridi- 
mensionnel, à laquelle étaient consacrés les premiers chapitres du livre. 
L'étude de ce paragraphe peut donc être faite indépendamment du $ 1. On 
y expose les applications des résultats obtenus pour les formes quadrati- 
ques dans les espaces vectoriels euclidiens à l’étude des courbes et surfaces 
du deuxième ordre. 

1. Loi de transformation des coefficients. On commencera par des raïi- 
sonnements applicables aussi bien aux courbes planes du deuxième ordre 
qu'aux surfaces du deuxième ordre dans l’espace. C’est pourquoi on ne 
précisera pas la dimension n qui peut être égale à deux ou trois suivant le 
cas considéré et on conviendra d’appeler les courbes et surfaces par un seul 
terme surface pour ne pas surcharger les énoncés. 

Considérons une équation arbitraire du second degré 


D atif +2 Y ati + ag = 0, (1) 


i.j=i im] 


reliant les coordonnées d’un point situé dans le plan ou dans l’espace. Ceci 
étant, aucune hypothèse ne sera faite ni sur ces points, ni sur leur existence. 
Si l’on change de repère et qu’on porte dans (1) l’expression des anciennes 
coordonnées du point courant en fonction des nouvelles, on obtient une 
nouvelle équation (également du second degré, en vertu des théorèmes 1 et 
2 du 8 1, ch. II). On dira dans ce cas que l’équation (1) a passé par change- 
ment des coordonnées à une nouvelle équation ou que ses coefficients se 
sont transformés. 


16* 
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Proposons-nous maintenant de rechercher une loi d’après laquelle se 
transforment les coefficients de l’équation du second degré lorsqu’on 
change de repère. Rappelons que le repère cartésien est composé d’un point 
(origine) et d’une base de l’espace vectoriel. Le changement de repère com- 
prend donc une translation de l’origine et une transformation de la base 
(voir $ 4 du ch. I). 

Si l’on change de base, l’origine restant la même, les anciennes 
coordonnées s'expriment en fonction des nouvelles par la formule 


ti = Y oi£*, 
K=] 


où o!, sont les éléments de la matrice de passage de l’ancienne base à la nou- 
velle. En portant cette expression dans l’équation (1), on obtient l’équation 
du deuxième degré 


Z ogoxoié 67 +2 L ap0kë * + am = 0, 
i,7,k,1 i, k 
avec coefficients 
dy = D jo io = À ook» oo = Co @) 
à, j i 
Si l’on transporte l’origine des coordonnées en un point de coordonnées 


pi(i<i<n)sans changer la base, les anciennes coordonnées s’expriment 
au moyen des nouvelles par la formule 


gi= + pi. 

La substitution dans l’équation (1) donne 
D CE + piE + pi) + 2 Y a(£! + p') + agp = 0, 
i, j i 

ou 
S aËE + Y a,(Eipi + Epi) +2 Y ali + &o = 0. 
ê, j 4, Î 

D'où 


%j = Aij, Go = Ÿ ayP" + @o, (3) 


k 


vu que les sommes Ÿ a£'p/ et Ÿ a, Ë/p' ne diffèrent que par les nota- 
tions des indices de sommation. 
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Les formules (2) et (3) expriment la loi de transformation des coeffi- 
cients de l'équation (1) lorsqu'on change de repère. L’expression du terme 
constant æ, n’est pas nécessaire ici. 

Les termes du second degré dans l’équation (1) constituent un poly- 
nôme homogène. On voit que ses coefficients @,; ne varient pas par transla- 
tion de l’origine des coordonnées, mais en revanche ils changent avec la 
base tout comme les coefficients de la forme quadratique. Aussi le poly- 
nôme ; 


D a, E'E (4) 


i,j=) 


peut-il être assimilé à une forme quadratique. Appelons-la forme quadrati- 
que mineure. 


PROPOSITION 1. Le rang et la signature de la forme quadratique mineure 
(4) ne varient pas dans tout changement de repère cartésien. 


Proposons-nous maintenant de déduire la loi de transformation des 
coefficients de l’équation (1) sous une autre forme pour pouvoir démontrer 
l’invariance de deux autres nombres. 

Considérons un polynôme homogène du second degré de ñn + 1 varia- 
bles 


>) QÈPES — ÿ EE + 2 ÿ @;)E' E0 + ap(EtY. (5) 
p.g=0 1,j=1 il] 


Le premier membre de (1) résulte de (5) pour £° = 1. 

Si l’on effectue une transformation linéaire biunivoque des variables, 
les coefficients du polynôme (5) se transforment comme les éléments de la 
matrice associée à la forme quadratique. Cette forme quadratique sera 
appelée forme quadratique majeure. De toutes les transformations on aura 
besoin de celles qui se présentent sous la forme (écrivons-la pour nr = 2) 


£0 1 0 oO E° 

el=la a all. 

el Lé à alle 
La variable £° ne varie pas ici, mais les autres se transforment suivant les 
formules 


# 0. (6) 


£! = ) oi £* + of Ë. 


Km! 


Si l’on pose £° = 1, on obtient la transformation la plus générale du repère 
cartésien. Ainsi, on a démontré la 
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PROPOSITION 2. Le rang et la signature de la forme quadratique majeure 
(S) ne varient pas dans tout changement de repère cartésien. 


La surface définie par l’équation (1) ne varie pas si l’on multiplie 
l’équation par un facteur différent de zéro. Dans ce cas, les rangs des for- 
mes quadratiques (4) et (5) ne varient pas, quant aux signatures elles ne 
peuvent modifier que leur signe (si le facteur est strictement négatif). D’où 
le 


THÉORÈMEÏ. Les rangs et les modules des signatures des formes quadra- 
tiques majeure et mineure sont quatre invariants de la surface du deuxième 
ordre. 


On désignera le rang et le module de la signature de la forme quadrati- 
que (4) respectivement par r et o, et le rang et le module de la signature de la 
forme (5) par R et £. 

2. Courbes planes du deuxième ordre. Dans le chapitre III (théorème 1 
du $ 1) on a montré qu’une équation du second degré dans le plan, écrite 
sous forme générale, peut être réduite à l’une des neuf formes canoniques 
par le choix convenable d’un repère cartésien. Il existe par conséquent dans 
le plan sept classes de courbes du deuxième ordre (les équations de deux 
classes de courbes ne sont vérifiées par les coordonnées d’aucun point). 

En composant les matrices associées aux formes quadratiques majeure 
et mineure pour les équations canoniques, on peut en déduire directement 
les valeurs de 7, o, R et £ correspondant à chaque classe d’équations. L’uni- 
que difficulté se présente dans le cas de parabole. La matrice associée à sa 
forme quadratique majeure n’est pas diagonale et est de la forme 


1 O0 O0 —-p 
A=|l0 1 oO 
[—-p 0 0 


Pour trouver le rang R et le module de la signature E, transformons cette 
matrice suivant la formule ‘SAS, avec 


1 O0 1! 
S=10 1 0 
—] O0 ! 
Il vient 
2p 0 O0 
(SAS = 10 1 0 
0 0 —-2p 


et l’on découvre que R = 3et £ = 1. Le fait que la matrice S n’est pas de la 


$ 2] THÉORIE GÉNÉRALE DES COURBES ET SURFACES D'ORDRE DEUX 247 


forme (6) est sans importance car R et £ restent invariants dans toute trans- 
formation définie par une matrice de déterminant non nul. 

Ecrivons les équations canoniques des courbes planes du deuxième 
ordre ainsi que les valeurs correspondantes des rangs et des modules de 
leurs signatures dans le tableau 1. 


Tableau ] 
Objet Equation canonique R L r o 
1 2 29 
Ellipse : Us + de F = | 3 1 2 2 
ad” b* 
Ne 22 
« Ellipse imaginaire » S + — = —| 3. 3 2 2 
« Couple de droites sécantes  a?(£!} + b?(£2} = 0 D 2 2: 2 
imaginaires » 
1 2 202 
Hyperbole s L F sr = | 3 1 2 0 
; 2 
Couple de droites sécantes (ER — (EX = 0 2 0 2 0 
Parabole (E2P = 2p£ 3 1 1 1] 
Couple de droites parallèles  (t?} = 2 O0 1 1]! 
« Couple de droites parallè-  (£?} = —a° 2 CD 1 
les imaginaires » . 
Deux droites confondues (EX = 0 RS 


On voit sur le tableau 1 qu’à toutes les équations d’une même classe 
correspondent les mêmes valeurs des invariants, tandis que les invariants 
correspondant aux équations des classes différentes sont distincts. Selon la 
proposition 8 du $ 3, ch. IV, deux courbes quelconques d’une même classe 
peuvent être amenées l’une sur l’autre par une transformation affine con- 
venablement choisie, mais aucune courbe ne peut devenir par transforma- 
tion affine une courbe d’une autre classe. On obtient donc la 


PROPOSITION 3. Les nombres R, E, r et o de deux courbes du deuxième 
ordre se confondent si et seulement si ces courbes peuvent être amenées 
l’une sur l'autre par une transformation affine. 


Si, comme au chapitre 111, on n'utilise que les repères cartésiens rectangulaires, toute 
forme quadratique mineure peut être décomposée en carrès, sans que cette décomposition soit 
canonique. Par exemple, dans le cas de l'ellipse, l'équation canonique renferme les coeffi- 
cients 1/a? et 1/b? affectant les carrés de £! et £?. Cela est lié au fait que dans une base ortho- 
normée la matrice de la forme quadratique doit coïncider avec la matrice de la transformation 
associée (comp. p. 235). Si donc on réduit la matrice 


a e PES 
ee | il «| M) 
Xi) An 
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de la forme quadratique (4) à une matrice diagonale par rapport à une base orthonormée, on 
doit avoir sur la diagonale les valeurs propres de la transformation associée. 

Etant donné que dans tout changement de base orthonormée, la matrice À derneure atta- 
chée à une même transformation linéaire, les racines de son polynôme caractéristique ne 
varient pas lorsqu'on passe d’un repère cartésien rectangulaire à l’autre. 

DÉFINITION. Les grandeurs ne variant pas lorsqu'on change de repère cartésien rectangu- 
laire sont appelées invariants orthogonaux (ou euclidiens). 

Au lieu des racines de l’équation caractéristique de la matrice (7) il est plus commode 
d'utiliser le système équivalent d'invariants orthogonaux, à savoir les coefficients de l'équa- 
tion caractéristique de cette matrice : 

a Le 4 
I =a, tas, Î,= Se 


Ai An 
La transformation de variables (6) présente une forme spéciale, de sorte que la forme 


quadratique majeure ne peut en général être décomposée en carrés (cas de R = 3,r = 1,c'est- 
à-dire de la parabole). Toutefois, si le repère rectangulaire se transforme en un repère rectan- 


gulaire, la matrice 
0j 02 
2 2 (8) 


1 22 


est une matrice orthogonale et son déterminant vaut 1 ou — 1. Dans ce cas, le déterminant de 
la matrice de passage de (6) est également + 1 et par suite, le déterminant de la matrice 


oo io x 


À = io Ai A (9) 


Lo 2 A2 
associée à la forme quadratique (5) demeure invariant par transformation (6). On a obtenu 
encore un invariant orthogonal de l'équation du deuxième degré, soit : 


I, = det À. 


On constate sans difficulté que la matrice de passage dans la formule (6) est orthogonale 
si et seulement si est orthogonale la matrice (8) et 0} = o = 0, autrement dit, si la base ortho- 
normée est remplacée par une base orthonormée et l’origine des coordonnées n’est pas dépla- 
cée. Les coefficients du polynôme caractéristique de la matrice À demeurent invariants si la 
matrice de passage est orthogonale, car dans ce cas À reste égale à la matrice de la transforma- 
tion associée à la forme (5). Donc les grandeurs 


@,, + Gp + Gp (10) 
et 
Ai 2, [oo %o oo 20 at) 
49: 9 %io An Lo An 


qui sont respectivement égales aux coefficients de À? et de — À dans l'équation caractéristique 
ne varient pas lorsqu'on passe d’une base orthogonale à l’autre, et, probablement, varient 
avec le déplacement de l’origine des coordonnées. Les grandeurs de ce genre sont dites semi- 
invariantes. En retranchant les invariants J, et Z, de (10) et (11) respectivement, on obtient les 


$ 2] THÉORIE GÉNÉRALE DES COURBES ET SURFACES D'ORDRE DEUX 249 


semi-invariants po €! 
oo Co 


io ii; 


Co 20 
Ayo An 


D'ailleurs, le fait que a, est un semi-invariant se déduit des formules (2). 

Les valeurs obtenues des invariants orthogonaux et des semi-invariants permettent de 
trouver les coefficients a, b et p dans les équations canoniques et définissent ainsi une courbe 
du deuxième ordre à sa position dans le plan près (voir propositon 9, $ 3, ch. IV). Le calcul 
des coefficients d'équations canoniques d’après les invariants orthogonaux est effectué dans 
tous les cours détaillés de géométrie analytique. 

Il ne faut pas oublier que les grandeurs J, , I, I, et K, sont liées au polynôme du deuxième 
degré et non pas à la courbe. Elles varient de façon évidente si on multiplie l'équation par un 
nombre différent de zéro. 


K, = 


3. Surfaces du deuxième ordre. Admettons que l’équation (1) relie les 
coordonnées d’un point dans un espace tridimensionnel. On montrera qu’il 
existe un repère cartésien rectangulaire dans lequel l’équation prend l’une 
des 17 formes canoniques. 

Choisissons pour base du repère recherché une base orthonormée dans 
laquelle la forme quadratique mineure se décompose en carrés. Ainsi donc, 
on partira de l’équation 


AE) + RER + NE + 200Ë! + 20 VE? + 2a4E + ag = 0 (12) 


sans oublier que la base orthonormée est choisie. Aucune contrainte n’est 
imposée aux coefficients, à l’exception de ce que À,, À et À, ne s’annulent 
pas en même temps. Les simplifications ultérieures se définissent par la 
proposition auxiliaire suivante. 


PROPOSITION 4. Si l'équation (12) contient le carré (avec un coefficient 
non nul) d'une coordonnée, on peut, par déplacement de l’origine des 
coordonnées le long de l'axe correspondant, rendre nul le terme renfermant 
la puissance première de cette coordonnée. 


Cette proposition se démontre comme la proposition 1 du $ 1, ch. III. 

Considérons pour plus de commodité quelques cas qui correspondent 
aux différentes valeurs des invariants R, £, r et a. 

1. Posons r = 3. Alors, en vertu de la proposition 4, l’origine des coor- 
données peut être transportée en un point pour lequel l’équation (12) se met 
sous la forme 


À (EP + REY + NE) + u = 0, (13) 


où À,, À, et À, ne sont pas nuls. 
1A. La condition R = 4 s’identifie au cas où le terme constant u de (13) 
est différent de zéro. En divisant par ce terme, on obtient 


-À\ œy - à ep - d @y = |. (14) 
H H H 
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1Aa. Posons £ = 4. Il vient alors que XÀ,, À, À, et u sont de même 
signe, de sorte que les coefficients de (14) sont strictement négatifs. L’équa- 
tion se réduit à la forme canonique 


EP, EX, EX 
Re 2 P 
Elle n’est vérifiée par aucun point. Cette équation est l'équation de 
l’ellipsoïde imaginaire. 
1 Ab. Si £ = 2et o = 3, le signe commun de X,, À et À, est opposé à 
celui de u. Les coefficients dans (14) sont positifs. L’équation se réduit à 
la forme canonique 


ŒY EX, EP 


œ U & À 
La surface est un el/ipsoïde. 
1Ac. Si £ = Oet o = 1, le signe d’une des valeurs propres (sans restrein- 
dre la généralité on peut poser que c’est À.) est opposé au signe commun 
des deux autres (À, et À) et coïncide avec celui de y. Dans l’équation (14) il 
y a deux coefficients positifs et un négatif. La forme canonique de l’équa- 
tion est 


— 1. 


ŒY | EP _ EP | 


œ U_&  + 
La surface est un hyperboloïde à une nappe. 
1Ad. Soit maintenant Z£ = 2, o = 1. Le signe de l’une des valeurs pro- 
pres (par exemple, de À.) est opposé au signe commun des deux autres (À, 
et À,) et est opposé au signe de u. Dans l’équation (14) il y a deux coeffi- 
cients négatifs et un positif. Elle se réduit à la forme 


ŒY _ŒY _ EP. 


dE + 
et définit un hyperboloïde à deux nappes. 
1B. Posons R = 3. Dans le cas considéré on a r = 3, ce qui équivaut à 
u = 0 ; l’équation (13) pour R = 3 est homogène. Signalons qu’on a obli- 
gatoirement L = 0. 
1Ba. Pour o = 3, toutes les valeurs propres \,, X et À, dans l’équation 
(13) ont le même signe, et l’équation peut être écrite sous la forme 


ŒY EP, EP | 


œ BB 
On la dénomme équation du cône imaginaire. La surface est réduite à un 
seul point. 
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1Bb. Si o = 1, une des valeurs propres diffère de signe des deux autres. 
L’équation se réduit à la forme canonique suivante 


EX , EX _EY 0 
2 62 Ÿ ° 
La surface est un cône du deuxième ordre. 
2. Posons maintenant r = 2. Dans l’équation (12), l’une des valeurs 


propres est nulle. Sans restreindre la généralité on peut admettre que c’est 
À, . En recourant à la proposition 4, réduisons l’équation à la forme 


AE TP + (EP + 2h E * + op = 0. (15) 
On transporte dans ce cas l’origine des coordonnées le long des axes £! et 


£2. Ecrivons le déterminant de la matrice de la forme quadratique (5) pour 
l'équation (15) : 


Gp 0 O0 a 
0 À, O0 0 

= — ai À À. 16 
0 0 À ) 30 1 ( ) 
œp 0 O0 0 


2A. La condition R = 4 équivaut à «.,, # 0 en vertu de l'égalité (16). 
On peut mettre l’équation (15) sous la forme 


NET) + RE) + 2 (E + ap/2a30) = 0, 
ce qui montre que la translation de l’origine des coordonnées le long de 
l’axe £ 3 définie par 
El =ElE SE E=E% + aç/223 
permet de transformer l’équation en 
AE!) + À (E2)2 + 2a9E° = O. (17) 
Ensuite, deux possibilités peuvent se présenter suivant les valeurs de 
l’invariant o. 
2Aa. a = 2. Dans ce cas, À, et À, sont de même signe. En substituant, si 
c’est nécessaire, le vecteur de base —-e.,âe,, on réduit l’équation à la forme 
El» F2)2 
EN, EN 
œ B 
C'est l'équation canonique du paraboloïde elliptique. 
2Ab. 9 = 0. Dans ce cas, X, et À, sont de signes différents, et l'équation 
se réduit à la forme canonique suivante 
EN _ ET _ 2 
a? g? un 
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(ici de même, il se peut qu’il faille modifier l’orientation dee,). Cette équa- 
tion définit un paraboloïde hyperbolique. 

2B. Supposons maintenant que R = 3. Il ressort alors de (16) que pour 
ces équations on a œy = 0, de sorte que le premier membre ne contient pas 
la variable £?. En accord avec ce qui a été dit au point 5 du & 1, ch. II, cela 
signifie que l’équation définit un cylindre dont les génératrices sont parallè- 
les au vecteur de base e, et la directrice est définie dans le plan des vecteurs 
e,ete, par l’équation 

AE + XXE 2) + ag = 0, (18) 
qui est l’équation (15) pour æ39 = 0. 

L’équation (18) définit dans le plan une des cinq coniques à centre. Il 
leur correspond cinq cylindres que cette équation définit dans l’espace : 
cylindre elliptique, cylindre hyperbolique, couple de plans sécants (la direc- 
trice est ici le couple de droites sécantes), couple de plans sécants imaginai- 
res (la surface se réduit à une droite et la directrice à un point, autrement 
dit à un « couple de droites sécantes imaginaires ») et, enfin « cylindre 
elliptique imaginaire » (la surface ne comprend aucun point et la « direc- 
trice » est une ellipse imaginaire). Les équations canoniques sont données 
dans le tableau 2. 

3. Considérons maintenant le cas de r = 1. Choisissons une base ortho- 
normée de manière que la forme quadratique (4) se décompose en carrés. 
On aboutit à l’équation 


AE) + 208! + 22208? + 2aypt? + ao = 0, (19) 
où À, est différent de zéro. 


3A. Supposons que a + aÿ # 0. On peut alors faire subir à la base 
une rotation autour de e,: 


EE! ET? = (a20Ë? + aypË )/v, E ? = (—a30t? + at )/v, 

où vu = Va, + a. L'équation (19) prend alors la forme 

AE 1) + 2008 ! + 2uë ? + ap = 0, 
qui, en vertu de la proposition 4, se transforme en 

AE 1)? + 2u£ ? + ago = 0. 
Ensuite, la translation de l’origine le long de l’axe £2, définie par 
E'=8!, E=E7+am/2v, E = Et, 
transforme l’équation en 
À, (Æ')2 + 2uË? = O. (20) 


L’équation (20) se réduit à la forme canonique (£!}? = 2œ£?, où & > 0. (Si 
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nécessaire, on peut modifier l’orientation de e; .) C’est l’équation du cylin- 


dre parabolique. 


3B. Siæy = «3 = 0, l'équation (19) ne contient que £ ! et se réduit faci- 
lement à l’une des trois dernières formes canoniques données dans le 


tableau 2. 


On achève ainsi la répartition en classes dont les résultats sont groupés 


dans le tableau 2. 
Objet 

« Ellipsoïde imaginaire » 

Ellipsoïde 


Hyperboloïde à une 
nappe 


Hyperboloïde à deux 
nappes 


« Cône imaginaire » 
Cône 
Paraboloïde elliptique 


Paraboloïde hyperboli- 
que 


Cylindre elliptique 


« Cylindre elliptique ima- 
ginaire » 


Cylindre hyperbolique 
Couple de plans sécants 


« Couple de plans 
sécants imaginaires » 
Cylindre parabolique 
Couple de plans parallè- 
les 
« Couple de plans paral- 
lèles imaginaires » 
Couple de plans confon- 
dus 


Equation canonique 


2 2 2 
Œ) EYE 
a? je FE y : 
Œ'»  Œ»7  &Y 
TT 
Œ EYE 
a BP Op. 
UE EX 
2 2 2 
EN EN ET, 
2 B? ÿ : 
Œ1)? (2) ; 
5 FE = 2f 
Œ'  (ŒE ; 
a ge 
CA CAL 
a? 8? Eu 
EN LE, 
a? 8? De 
EYE _, 
FE 8 
EYE 
a 
ET ET Do 
a? 8? = 
(Œ&')? = 2at° 
Œ&!} — «= 0 
Œ'} +a=0 
&'} = 0 


Le) 


ty 


Tableau 2 


CHAPITRE X 


ÉLÉMENTS D’ALGÈBRE TENSORIELLE 


$ 1. Tenseurs dans l’espace vectoriel 


1. Objets géométriques. Dans les chapitres VI à VIII on a étudié les 
espaces vectoriels et les objets de nature différente définis dans ces espa- 
ces : transformations linéaires, formes quadratiques, etc. L’étude de cha- 
que objet s’appuyait sur une définition formulée indépendamment de la 
base dans l’espace. Par exemple, la transformation linéaire était définie 
comme une application de l’espace dans lui-même qui satisfait à deux con- 
ditions (comp. (1), $ 3, ch. VI). Ainsi donc, ces objets existent et, en prin- 
cipe, peuvent être étudiés comme les objets en géométrie sans qu’on intro- 
duise une base. On dira que ce sont des objets géométriques. 

Bien qu’un objet géométrique existe indépendamment de la base, il est 
utile de choisir une base et de définir cet objet par rapport à cette base au 
moyen d’un système ordonné de nombres appelés composantes de l’objet. 
Par exemple, le choix d’une base établit une correspondance biunivoque 
entre les transformations linéaires et les matrices carrées. Une transforma- 
tion linéaire d’un espace n-dimensionnel possède n? composantes. Le fait 
qu’un objet reste invariant dans tout changement de base entraîne la varia- 
tion de ses composantes. Dans tous les cas rencontrés, on a pu calculer les 
composantes de l’objet dans une base en fonction de ses composantes dans 
une autre base et des éléments de la matrice de passage d’une base à l’autre. 

Outre les objets géométriques étudiés, il en existe beaucoup d’autres. Il 
n’est pas toujours commode d’en donner une définition indépendante de la 
base. Parfois un objet géométrique est défini au moyen de ses composan- 
tes. Les composantes de l’objet géométrique diffèrent d’un ensemble arbi- 
traire de nombres par la propriété suivante qu’on prend pour définition 
rigoureuse. 


DÉFINITION. On dira que dans un espace vectoriel est défini un obyef géo- 
métrique si à toute base correspond une famille ordonnée de nombres 
(composantes) et une seule et si les composantes dans une base peuvent être 
exprimées en fonction des composantes dans une autre base et des éléments 
de la matrice de passage. Cette relation entre les composantes de deux bases 
est appelée loi de transformation des composantes de l’objet géométrique. 
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Si à toute base, par exemple, correspond un même nombre, on dit 
qu’est donné un objet géométrique à une seule composante, appelé inva- 
riant. La loi de transformation se traduit ici par le fait que cette compo- 
sante ne varie pas dans tout changement de base. 

A titre d’un autre exemple, considérons la forme quadratique k et fai- 
sons correspondre à chaque base e le déterminant à de sa matrice K dans 
cette base. On obtient un objet géométrique à une seule composante ô = 
= det X. Vu que dans la base e” = eS on a K° = 'SKS, la loi de transfor- 
mation de la composante de cet objet est de la forme 6’ = ô(det S}. 

Soit donné le vecteur x. Associons à la base e la somme des composan- 
tes £' de x dans cette base. A chaque base sera associé un nombre bien 
déterminé y = y £'. Cependant, une telle correspondance ne définit pas 

{ 
un objet géométrique. En effet, le nombre y’ correspondant à la base e” 
s’exprime non pas en fonction de y mais en fonction des composantes du 
vecteur : 


vy=htt= À 74. 
i i,J 
(7 sont ici les éléments de la matrice de passage de e’ à e.) 

Dans ce chapitre, on étudiera un espace vectoriel réel 7-dimensionnel 
_}. On conservera toutes les notations adoptées auparavant. Si l’on a deux 
bases e ete , la matrice de passage sera toujours notée S, et ses éléments, 
dÿ, de sorte quee’ = eSoue; = D cie. Les éléments de la matrice de 


passage inverse S - ! seront notés Th. 


Considérons un objet géométrique quelconque. Désignons ses composantes dans la base e 
par @,,., æ,, et les composantes dans la base e” par &,,..., a, La loi de transformation des 
composantes se définit par N fonctions F,, …, F,, dont chacune dépend de N + n? variables 
indépendantes : 


af = Fa... an, 1) (K = 1,..., N), 
ou d’une façon plus concise 
ax = FL(a, S). (1) 


Considérons une troisième base e ” = e’R = eSR. Soient æ, ,..., a , les composantes de 
l'objet dans cette base. On peut passer de e à e” directement, la matrice de passage étant le 
produit SR. On obtient 


ag = F,(a, SR). 
D'autre part, on peut passer de e à e” et dee à e”. Il vient alors 
ax = Fa, R) = F,(F;a, S), …, F,(a@, S), R). 
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Vu que les composantes de l’objet se définissent par la base de façon univoque, les fonctions 
F, pour tous X = 1,.., N doivent satisfaire à la condition 


k 
F,(a, SR) = F,(F, (a, S), …,F,, (a, S), R), (2) 
quels que soient æ, S et R. On a obtenu la 


PROPOSITION 1. Si les fonctions de la forme (1) déterminent la loi de transformation d'un 
objet géométrique, elles doivent satisfaire à la condition (2). 

L’assertion réciproque est également vraie. 

PROPOSITION 2. Toute famille de fonctions de la forme (1) satisfaisant à la condition (2) 
définit la loi de transformation d'un objet géométrique. 


Pour le démontrer, construisons cet objet géométrique de la façon suivante. Soient des 
composantes arbitraires par rapport à une base e (on suppose que les fonctions considérées 
sont définies pour toutes les valeurs des variables indépendantes). Cherchons les composantes 
de l’objet par rapport à d’autres bases en traitant la famille des fonctions données comme loi 
de transformation. Dans ce cas, étant donné deux bases quelconques e ete”, les composan- 
tes dans e” se déterminent par les mêmes fonctions des composantes dans e‘ et par les élé- 
ments de la matrice de passage de e” à e””. En effet, en utilisant les notations introduites plus 
haut,onaa, = F,(a, SR) et œ, = F,(a, S). D'où, en vertu de (2), a, = Fsla”, R). 

Il reste à montrer que la transformation ainsi définie fait associer à chaque base une seule 
famille de nombres. L’unicité ne peut être perturbée que par le fait qu'il existe plusieurs 
façons pour obtenir une même base : étant donné des bases quelconques e’, e”, …, e(), on 
peut passer deeàe’,dee’ àe”, etc. et, enfin, de e(*) à f. En appliquant plusieurs fois la con- 
dition (2), on se convainc que tout passage à la base f fournit les mêmes composantes par rap- 
port à f que le passage direct de e à f. 


On étudiera les objets géométriques les plus simples appelés renseurs. 
La loi de transformation de leurs composantes est telle que les nouvelles 
composantes sont des polynômes homogènes linéaires d’anciennes compo- 
santes. On la décrira en détail plus loin. On a pris l’habitude d’ordonner les 
composantes des tenseurs en les numérotant avec plusieurs indices. Le 
point suivant sera consacré aux notations. 

2. Matrices multidimensionnelles. Rappelons qu’à la page 122 on a 
défini la matrice comme fonction associant un nombre à chaque couple 
ordonné (i,/)},oùief{l,….,m},jef{l1,.…,n). On généralisera cette défini- 
tion. Puisqu’on n’aura besoin que de matrices analogues aux matrices car- 
rées, tous les indices appartiendront à un même ensemble {1, .…,n). 


DÉFINITION. On appelle matrice s-dimensionnelle d'ordre n la fonction 
sur l’ensemble des s-uples de la forme (i,, …, à), où é,, …, i prennent les 
valeurs 1, ..., 71. 

Soulignons que l’ordre de la matrice coïncide avec la dimension de 
l’espace vectoriel considéré. Pour expliquer l’origine du terme « matrice 
s-dimensionnelle », considérons la matrice tridimensionnelle d’éléments 
a;,. Pour toute valeur fixée de l'indice & = &,, les éléments de type ay, 
constituent une matrice carrée d'ordre 77. Ainsi, tous les éléments a; Se 
répartissent en n matrices carrées d'ordre n : la, l, .…, la, Î. On peut se 


représenter ces matrices comme des couches disposées l’une au-dessous 
l’autre, en formant de la sorte un cube qui contient n° blocs dans chacun 
desquels est inscrit un nombre. D'une façon analogue, une matrice quadri- 
dimensionnelle peut être considérée comme un n-uple ordonné de n7 matri- 
ces tridimensionnelles, etc. 

Il est commode d’assimiler les matrices-lignes et les matrices-colonnes à 
des matrices unidimensionnelles. Leurs éléments sont numérotés avec un 
seul indice. 

En choisissant les notations pour la matrice s-dimensionnelle, on peut 
pour plus de commodité, convenir d'écrire certains indices en haut et les 
autres en bas. Mais, une fois la notation adoptée, on observera rigoureuse- 
ment la disposition choisie pour les indices. Si l’ordre des indices n’est pas 
réglementé, on considérera que les indices inférieurs suivent les indices 
supérieurs comme s'ils étaient écrits à droite de ces derniers. 

Les matrices multidimensionnelles sont difficiles à écrire d’une façon 
explicite. On a convenu de considérer tout indice désigné par une lettre 
comme une variable prenant les valeurs 1, .…, n. Si est écrite une expression 
contenant un indice littéral *) qui n'est pas un indice de sommation, on 
admet que sont écrites n expressions semblables pour chaque valeur de cet 
indice. S'il y a plusieurs indices, la convention ci-dessus se rapporte à cha- 
cun d’entre eux. Par exemple, 1‘: désigne l’ensemble de tous les éléments 
de la matrice s-dimensionnelle, et la relation ak = Bix veut dire que sont 
égaux les éléments qui occupent la même place dans deux matrices tridi- 
mensionnelles, ou bien que les matrices sont égales. 

Introduisons une nouvelle notation de sommation. Soit une expression 
contenant une lettre ou un produit de plusieurs lettres affectées d'indices 
dont l’un figure deux fois : une fois en haut et une fois en bas. On entendra 
par cette expression la somme des termes de cette forme, écrits pour toutes 
les valeurs de l'indice qui se répète, sans écrire le symbole de sommation. 
D'une façon analogue, s’il y a plusieurs indices qui se répètent, on a en vue 
une somme multiple. Dans les chapitres V à VIII, on a constamment ren- 
contré des sommes de ce genre mais on écrivait le symbole de sommation. 
Dorénavant, on ne le fera plus. Par exemple, les formules 


n 
fc) = Y xEi, a = Ÿ ajoiol 
is! ii. 
seront écrites sous la forme 
f(x) = xE, à,, = @,04 4. (3) 
*) Pour désigner les indices, nous utiliserons le plus souvent les lettres i, j, K, /, affectées 


quelquefois de leurs propres indices. La lettre n désignera toujours un nombre fixé, la dimen- 
sion de l'espace. 


17—6442 
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3. Définition et exemples. Soit un espace vectoriel réel Z# de di- 
mension ñ. 


DÉFINITION. On dit qu’un tenseur de type (p, q) est défini dans Æ# si à 
chaque base est associé une matrice (p + q)-dimensionnelle d'ordre n. 


Ceci étant, quelles que soient les bases e et e”, les éléments dj cp et a! je 


des matrices associées respectivement à e ete’ doivent être liés par les rela- 
tions 


cfa Ps (4) 


où ci sont les éléments de la matrice de passage deeàe',et Tk les éléments 
de sa matrice inverse. 

Dans le second membre de (4), la sommation est réalisée suivant tous les 
indices k et /, autrement dit on a une somme de multiplicité p + q. On con- 
viendra d’écrire en haut les indices auxquels, dans chaqun des #7 *4 termes, 
correspondent les facteurs 7! . Ces indices sont dénommés contravariants. 
Par contre, on écrira en bas les indices auxquels, dans chaque terme, cor- 
respondent les facteurs 0; . Ce sont les indices covariants. 

Les éléments de la matrice associée à une base dans # s'appellent com- 
posantes du tenseur dans cette base. 

On dit que le nombre p + g est valence du tenseur, et que g et p sont 
respectivement valence covariante et valence contravariante. 

Soulignons que malgré la complexité de la somme dans le second mem- 
bre de (4), chaque terme contient une seule composante ancienne du ten- 
seur. Cela veut dire que les nouvelles composantes s’expriment en fonction 
des anciennes par des polynômes homogènes linéaires. La complexité de la 
formule (4) est due à l’expression des coefficients de ces polynômes par 
l’intermédiaire d’éléments de la matrice de passage. 

Deux tenseurs sont égaux s’ils sont de même type et possèdent des com- 
posantes égales dans une certaine base. Il découle alors de la loi de trans- 
formation que leurs composantes sont égales dans toute base. 


EXEMPLE 1. Le vecteur est un tenseur de type (1, 0). En effet, étant 
donné un vecteur, à chaque base correspond une matrice unidimension- 
nelle, la matrice-colonne. Ceci étant, les éléments des matrices-colonnes 
associées à des bases égales sont liés par la formule (4) du $ 1, ch. VI : 


£i _ oEK. 
Cherchons, en partant de cette relation, l’expression de £ “ en fonction 
de £' : | 

E4 = bi, 


c’est la loi de transformation des composantes du tenseur de type (1, 0). 
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ExEMPLE 2. La fonction linéaire sur l’espace # est un tenseur de type (0, 
1). En effet, étant donné une fonction linéaire, à chaque base correspond 
une matrice unidimensionnelle, la matrice-ligne des coefficients de cette 
fonction. Lorsqu'on change de base, les coefficients de la fonction linéaire 
se transforment suivant la formule (4) du $ 1, ch. VIII : 


— nk 


C'est justement la loi de transformation des composantes du tenseur de 
type (0, 1). Les tenseurs de type (0, 1) sont appelés covecteurs. 


ExEMPLE 3. La transformation linéaire de l’espace _ est un tenseur de 
type (1, 1). En effet, étant donné une transformation linéaire, à chaque 
base correspond une matrice bidimensionnelle d'ordre n. Si la base change, 
les éléments de la matrice se transforment suivant la formule (1) du $ 4, 
ch. VI: 4° = S-1AS, ou 

k 


À = vi nl 


EXEMPLE 4. La forme bilinéaire sur l’espace _= est un tenseur de type (0, 
2). En effet, étant donné une forme bilinéaire, à chaque base correspond 
une matrice bidimensionnelle d'ordre n. Les éléments des matrices asso- 
ciées à deux bases sont liés par la formule : 


B; = cfojBur. 
Signalons que la forme bilinéaire symétrique et la forme quadratique 


qui lui correspond représentent le même tenseur, vu que leurs matrices se 
confondent dans toute base. 


EXEMPLE 5. Un invariant peut être assimilé à un tenseur de type (0, O). 


ExEMPLE6. Un tenseur important de type (1, 1) est le symbole de Kro- 
necker dont les composantes constituent, dans une certaine base, la matrice 


unité : 
| O0, i+#j, 
Ô!. = S 
Selon la loi de transformation, on obtient 
ô;' = T4 0j Ôf . (6) 


Si ôf se définissent par la formule (5), parmi les n? termes dans le second 
membre de (6) sont nuls tous ceux pour lesquels & # /. Donc, ô;' = 7 CH ù 
Or ri, o* est un élément du produit S-!S. Il s'ensuit que à = êi. On voit 
que si fe tenseur de type (1, 1) possède dans une base la matrice unité, il la 
conserve dans toute autre base. 


[7 
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EXEMPLE 7. Considérons une fonction F(x; Re X,,) de g vecteurs, 
linéaire relativement à chacun d’eux si les autres sont fixés. Cette fonction 
est une généralisation de la forme bilinéaire. Décomposons chacun des vec- 
teurs x,,...,X, suivant les vecteurs d’une base quelconque e. En vertu de la 
linéarité de rapport à chacun des vecteurs, 


EX x = F(Ee;, is tee, ) L 

= £}.. EeF(e,…., =. Fe ie, 
où les coefficients @;.. bi Fe, …, €) remplissent le même rôle que les 
coefficients de la forme bilinéaire. Démontrons que dans tout changement 
de base, ils se transforment comme les composantes du tenseur de type 


(0, g). A cet effet, considérons la base e” = ofe, et profitons de nouveau 
de la linéarité de la fonction : 


F(e; , €) = F(oie,, . 0j2e,. ) = cf! _ dia F(e, , es eg) 


L'égalité obtenue démontre l’assertion énoncée. 

D'une façon analogue, on peut construire un exemple de tenseur de 
type (P, q) quelconque. La fonction F doit dans ce cas dépendre de q vec- 
teurs et de p covecteurs et être linéaire en chacun d’eux. On peut calculer la 
valeur de cette fonction sur les vecteurs x,, .…, x, et sur les covecteurs 
[1, .…, IP en décomposant les vecteurs x,, x, suivant les vecteurs d’une 
base quelconque lle, , …, e,N dans # et les covecteurs /!, …, /P suivant les 
vecteurs pl, .…, p”" de la base dans l’espace Æ#*, qu’on choisit bior- 
thogonale à la base Île,, ..., e Î. Rappelons (comp. p. 224) qu’une base 
Ip', …, pi dans l’espace _#* de tous les covecteurs est dite biorthogonale 
à la base Île,, ..…., el dans # si 


p'(e,) = Ô} 
En vertu de la linéarité de la fonction F, il vient 
FGx,..,x,, 11,17) = Fe, ,.….,Ete., NP Ab 8 = 


= #1. Ben. MF(e,..,e,, ph. PP) = 
_ Ja 1 P 
= a “gl EX . À; 
La base Ip !, .…., p "Ü biorthogonale à la base lle, , .…, el est composée 
des covecteurs p Des rip'. En effet, 
p'(e;) = rP'(oj ee) = ri of ô!, = ô. 
Il s'ensuit comme plus haut que &! ju M se transforment comme les compo- 
santes du tenseur de type (p, gq). 


Les fonctions étudiées dans cet exemple s’appellent fonctions multili- 
néaires. 
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Le dernier exemple montre qu’il existe des tenseurs de tout type (p, q). 
Le tenseur de type (p, q) sera défini si l’on construit une fonction mul- 
tilinéaire de p covecteurs et q vecteurs. On peut la construire à partir 
d’une base et d’une matrice de coefficients oi” Pi Après quoi à chaque 
(p su -uple de p covecteurs et q vecteurs on es faire correspondre un 
nombre 


ae En EN 


ce qui définit bien une fonction multilinéaire. 

4. Addition et multiplication par un nombre. Pour les tenseurs de même 
type on définit l’opération d’addition. A savoir, soient oi” . et B} : les 
composantes de deux tenseurs À et B de type (p, q) dans a: même Le e. 
Associons à cette base une matrice (p + g)-dimensionnelle en additionnant 
les composantes des tenseurs À et B de mêmes indices : 

TEL — TEL sich 
jh = dir + Bi. ü 
PROPOSITION 3. Si à chaque base on fait correspondre des nombres Ÿ; P 
| Je 
définis en fonction des composantes des tenseurs À et B dans cette base par 
la formule (7), on définit par là même un tenseur de type (p, q). 

Pour le démontrer, il suffit d’établir comment se transforment les nom- 

bres ve lorsqu’on effectue un changement de base. On a 
| ] 1 

QUEP = Th ee TP 0). OR P 

et 
‘ ….{ = ] ; | 

B; 5? T4. se TB } .… di l 

En additionnant membre à membre ces égalités, on obtient 
“y... UE = ] ; l l° l'° 
je LE 4 + SFA Le Th .… Ted . of (Cris on + Bi; P ), 

autrement dit, on obtient la loi tensorielle : A Ornalion Ve 


DÉFINITION. Le tenseur C de composantes v: g définies par la oimule 


(7) s’appelle somme des tenseurs À et B et se iote A + B. 

Ainsi, pour calculer la somme des tenseurs, on additionne leurs compo- 
santes correspondantes. Cela signifie que la somme habituelle des vecteurs 
sera leur somme tensorielle si l’on les additionne comme des tenseurs. Il en 
est de même de la somme des transformations linéaires, définie dans le cha- 
pitre VI. (La définition de la somme y a été donnée pour des applications 
arbitraires.) 


PROPOSITION 4. Faisons correspondre à chaque base les nombres 
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Aa} , Où a; ie sont les composantes du tenseur À dans cette base. 
…Jq “le 


Cette correspondance définit un tenseur. 


On ne donne pas la démonstration de cette proposition, car elle se fait 
sur le modèle de celle de la proposition 3, où on utilise le fait que les 
seccnds membres des équations (4) sont des polynômes homogènes linéai- 
res par rapport aux anciennes composantes. 


DÉFINITION. Le tenseur défini dans la proposition 4 s'appelle produit du 
tenseur À par le nombre X et se note XA. 

Les propriétés des opérations introduites sont énoncées dans la proposi- 
tion suivante. 


PROPOSITIONS. L'ensemble de tous les tenseurs de type (p, q), muni des 
opérations d'addition et de multiplication par un nombre est un espace vec- 
toriel de dimension n° *1. 


Laissons au lecteur le soin de vérifier tous les axiomes dans la définition 
de l’espace vectoriel. 

Choisissons une base quelconque dans # et considérons les tenseurs 
dont l’une des composantes dans la base donnée est égale à l’unité et les 
autres sont nulles. Il existe exactement #77 *4 de tels tenseurs car un tenseur 
quelconque de type (p, q) possède n° *4 composantes. Ces tenseurs sont 
linéairement indépendants et chaque tenseur est leur combinaison linéaire 
(dont les coefficients sont les composantes du tenseur donné). Donc, la 
dimension de l’espace des tenseurs de type (p, g) est égale à n° +4. 

5. Multiplication des tenseurs. Soient À un tenseur de type (p, q) et B 
un tenseur de type (7, s). On peut faire correspondre à une base quelconque 
e une matrice (p + q + r + s)-dimensionnelle composée des produits de 
chaque composante de À par chaque composante de B. Ordonnons ces 
produits en écrivant d’abord les indices se rapportant à À puis ceux qui se 
rapportent à B. Il vient 


te _ Pa lp ghi-k ; (8) 
Jidghiels Jef NS 


PROPOSITION 6. Si à chaque base on fait correspondre des nombres 7; 


définis en fonction des composantes des tenseurs À et B dans cette base par 
la formule (8), on définit par là même un tenseur de type (p + r, q + S). 


Faisons la démonstration pour le cas des tenseurs de types (1, 1) et 
(0, 1). Dans le cas général, la démonstration ne diffère que par des nota- 
tions plus encombrantes. Exprimons les composantes des tenseurs À et B 
par rapport à la base e” en fonction de leurs composantes par rapport à la 


base e : . | 
a; = Th 0Ï Of » B,, = omB- 
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D'où 
= ajBn = tojohatl, = noir, 


autrement dit, les quantités y* se transforment par changement de base 
comme les composantes du tenseur de type (1, 2). 

A la différence des précédentes, cette démonstration utilise l’expression 
des coefficients affectant les anciennes composantes dans les formules (4) 
par l’intermédiaire de o; et 7) 

DÉFINITION. Le tenseur défini dans la proposition 6 s’appelle produit du 
tenseur À par le tenseur B et se note À @ B. 


ExempPLe. Considérons deux fonctions linéaires f et h sur / et faisons 
correspondre à chaque couple de vecteurs x et y le nombre f(x) : h(>). 
Admettons que dans une certaine base les valeurs de f et h sont f(x) = x.£' 
ethO@) = u,n*, où £'et n° sont les composantes des vecteurs x et y. Dans ce 
cas 


b(x, y) = f(x): hO) = Ce Et)(u,n*) = Cu, )Etnt, 


car pour calculer le produit de deux polynômes on doit multiplier chaque 
terme du premier polynôme par chaque terme du second. Ainsi donc, la 
fonction b que nous avons définie est une forme bilinéaire, c’est-à-dire un 
tenseur de type (0, 2). Ce tenseur est le produit tensoriel des tenseurs f et h. 
On peut écrire b = f @ h, ou en composantes, B, = x;u,. 

La multiplication tensorielle n’est pas commutative. Montrons-le sur 
l’exemple suivant. Le produit tensoriel de deux vecteurs x et y est le tenseur 
x © y de type (2, 0). Ses n? composantes forment une matrice carrée (le 
premier indice est celui de la ligne). Si £' et n* sont les composantes de x et y 
dans une certaine base, la matrice des composantes de x @ y dans cette 
base est de la forme 


En! £l n° £ln" 
E2n! £2n° £2r" 
Enn! Er Em" 


En construisant de la même façon la matrice des composantes du tenseur 
y © x, on obtient la matrice transposée. Chaque composante £'7# est le 
produit de deux nombres, de sorte que £'n* = n*£'. Mais l’ordre des com- 
posantes des tenseurs x @ y et y @ x est différent. Il en est de même pour le 
produit de tenseurs arbitraires. 

Laissons au lecteur le soin de démontrer que la multiplication tenso- 
rielle est associative et distributive relativement à l’addition. On constate de 
même aisément que la multiplication d’un tenseur par un nombre, intro- 
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duite auparavant, coïncide avec la multiplication par le tenseur (0, 0) ayant 
ce nombre pour composante. 


PROPOSITION 7. Tout tenseur de type (p, q) est une combinaison linéaire 
de produits dont chacun contient p vecteurs et q covecteurs. 


Il suffit de démontrer que les produits de forme exigée sont les tenseurs 
qui ont servi dans la proposition S à la construction de la base dans l’espace 
des tenseurs de type (p, g). On le fera pour les tenseurs de type (2, 1) car 
dans le cas général le raisonnement est le même. 

Soit le tenseur Q dont la composante 8% par rapport à la base le,, … 

., €, est 1 et les autres composantes sont nulles. Considérons les vecteurs 
de base e, , e, et le covecteur f dont les composantes par rapport à Île,, … 

., e,X sont (1, 0, ..…, 0). Vu que e, et e, ont pour composantes (0, 1, 0, … 

., 0) et (0, 0, 1, 0, …, 0), le produit e, © e, © f a une seule composante 
(d’indices 2, 3 et 1) égale à l’unité, et les autres composantes nulles. Donc, 
Q=e, Q e, @ f. L’assertion se démontre de la même manière pour les 
autres tenseurs de base dans pe des tenseurs de type considéré. 


6. Contraction. Soient oi P les composantes d’un tenseur de type 


(p, qg) dans la base e, avec p > 1 @ qg > 1. Choisissons un indice supérieur, 
par exemple le premier et un indice inférieur, par exemple le dernier. Pour 
chaque ensemble donné de valeurs des autres indices, considérons la 
somme de toutes les composantes du tenseur À où les valeurs des indices 
choisis sont les mêmes : 


B2ip _ CHEAP + ape . P LE. + ar (9) 


Ji Jq-1 Ji. .. 11° 


PROPOSITIONS. Faisons NP à chaque base une farnille de nom- 
bres que l'on obtient à partir des composantes a” “p du tenseur de type 
(p, qg) en appliquant la formule (9). Cette cbrrebondence définit un ten- 
seur de type (p — 1,q — 1). 

Pour le démontrer, voyons comment se transforme la famille de nom- 
bres ainsi définie, Rs oNl change de base. On a 


B;'2""p = @. so = ES TR ARE + TR 0 .. ME L'ANMLE 


Ji: Ja-1 Ji x 
Or 7 og = CLR , de sorte que cette expression est égale à 
CXA TR, + A of —_ CPE. NT IS 


En sommant suivant les indices / à m, , On voit que tous les termes s’annu- 
lent, à l” exception de ceux pour lesquels 4, = m,. En posant /, = m, =K, 
on peut écrire 


Bb = 72 ... ve o! … oda- a “Mp 


Jr 74 l M; M) Ji Ja-1 lq- 1 
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Cela veut dire que les nombres 6}? _, se transforment comme les compo- 
santes du tenseur de type (p — 1,q — 1). 


DÉFINITION. Le tenseur déduit du tenseur À selon la formule (9) 
s’appelle tenseur contracté par rapport au premier indice supérieur et au 
dernier indice inférieur. On définit de façon analogue le tenseur contracté 
par rapport à tout indice supérieur et tout indice inferieur. 

On appelle produit contracté de deux tenseurs un tenseur obtenu par la 
contraction de leur produit tensoriel, relative à un indice supérieur d’un 
facteur et à un indice inférieur de l’autre. Par exemple, l’image d’un vec- 
teur x de composantes £’ par la transformation linéaire À de matrice œ est 
le produit contracté des tenseurs correspondants : 7! = CHA = ait + 

it QE, 

La valeur de la fonction linéaire f de coefficients x, sur le vecteur x de 
composantes £' est le produit contracté £ = x;£ï. 

Un exemple significatif de la contraction des indices est donné par le 
tenseur de type (1, 1). On aboutit au tenseur de type (0, 0), c’est-à-dire à un 
invariant. Si l’on désigne les composantes d’un tenseur À de type (1, 1) par 
ai, le tenseur contracté obtenu est de la forme a; = a} + … + an. C’est la 
somme des éléments diagonaux de la matrice À formée des composantes de 
A. On dit que la somme des éléments diagonaux de la matrice À est sa trace 
et on la note tr A. On a vu à la page 195 que trA est un invariant si À est la 
matrice d’une transformation linéaire. Maintenant on y est arrivé en par- 
tant d’un point de vue plus général. 

Par contre, pour les tenseurs de type (0, 2), le tenseur contracté n’est 
pas défini. Il s’ensuit que la trace de la matrice associée à la forme quadra- 
tique ne sera pas un invariant, elle peut être modifiée par changement de 
base. Laissons au lecteur le soin de le vérifier. 

7. Transposition. Considérons un ensemble d’éléments de la matrice 
s-dimensionnelle pour lequel tous les indices, sauf deux, ont des valeurs 
fixées. Cet ensemble forme une couche bidimensionnelle, autrement dit 
une matrice carrée. Ainsi, toute la matrice se subdivise en des couches bidi- 
mensionnelles qui correspondent aux différentes combinaisons des valeurs 
de tous les indices, à l’exception de deux choisis. 

On appelle transposition d’une matrice s-dimensionnelle par rapport à 
deux indices quelconques une permutation de ses éléments qui transpose 
chaque couche qu’on obtient en fixant tous les indices à l'exception des 


deux donnés. Par exemple, la transposition de la matrice a} “ le par rapport 
aux deux premiers indices supérieurs donne la matrice pi” ÿ & iée à la pre- 
mière par l'égalité 


Gire = ongre. ao) 
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D'une façon générale, on entend par transposition suivant un ensemble 
d'indices le résultat des transpositions successives suivant différents cou- 
ples d’indices de cet ensemble. 

L'opération de transposition est parfois appelée permutation des indi- 
ces. 

Considérons à titre d'exemple le cas de 7 = 2. Soit une matrice tridi- 
mensionnelle «;,. Aux valeurs 1 et 2 du premier indice sont associées deux 
couches. Ecrivons-les l’une à côté de l’autre : 


[a 12) %: ea 
21 Li My Don 


La transposition de cette matrice par rapport à deux derniers indices donne 


la matrice B;, = a;,;, ou sous forme développée 
Bin Bir2| Ban "| - pr Lai | Mu a| 
Bin BinlB2: Liz M2 A Am 


Si on considère une transposition plus compliquée +;, = a,,, la matrice 
Vijk prend la forme 


pr V2 


Va a] - [a TT 
Vian V2 


12 O2 


2; a] | 
An Am 


PROPOSITION 9. Supposons qu'à chaque base est associée une matrice 
(p + q)-dimensionnelle 6; É k déduite de la matrice a} cf des composan- 
tes du tenseur À par une ans DOtion dans laquelle . sont permutés que 
les indices supérieurs ou les indices inférieurs. Cette correspondance définit 
un tenseur B de même type que À. 


Il suffit de le démontrer pour des transpositions qui ne changent l’ordre 
que de deux indices, vu que toute transposition est le résultat d’une succes- 
sion de ces transpositions. La démonstration est de plus identique pour 
tout couple d’indices supérieurs ou inférieurs. Aussi se limitera-t-on à 
démontrer la proposition pour une transposition relative à deux premiers 
indices supérieurs, écrite dans la formule (10). On a 


kaky..k 
B;ù: 3P = aps D = Tê Th TR : TE, 0} ce LATE p 
On est en droit de changer la notation des indices de sommation et rempla- 


cer X, par k,, et k, par k,, et dans chaque terme permuter les facteurs. On 
aboutit alors à la formule 


Bas te = À re 7 ù.. Te di. . de oki n- Hé 
= À À TR, ee TE 07 ee Gp BE 


qui exprime la loi tensorielle de transformation de gr: NA 


Y221 
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DÉFINITION. On dit que le tenseur B défini dans la proposition 9 est le 
transposé du tenseur À. 

Remarquons que la démonstration de la proposition 9 n’aurait pas pas- 
sée si on avait voulu permuter un indice supérieur avec un indice inférieur. 
Il en découle par exemple le fait suivant. Etant donné deux matrices À et 
S”!' AS qui définissent une même transformation linéaire dans deux bases 
différentes, leurs transposées ‘4 et ‘S'A'(S-1) définissent des transforma- 
tions linéaires différentes. 

Mais si l’on transpose les matrices B et ‘SBS qui définissent, dans diffe- 
rentes bases, la forme bilinéaire b, on aboutit aux matrices ‘B et 'S'BS qui, 
elles aussi, définissent une même (en général, une autre) forme bilinéaire ‘b. 
Ces formes bilinéaires sont liées entre elles. On vérifie sans difficulté que 
D(x, y) = DC, x). 

Les tenseurs qui sont des produits de deux tenseurs donnés pris dans 
l’ordre différent, se déduisent l’un de l’autre par transposition. 

8. Symétrisation et alternation. Considérons le tenseur À dont la 
valence contravariante p est au moins égale à un nombre donné s > 2. 
Choisissons s indices supérieurs quelconques et calculons le nombre de ten- 
seurs qu’on peut obtenir de À par la transposition relative aux indices choi- 
sis. En permutant les indices deux à deux on peut les disposer dans un ordre 
quelconque. Aussi le problème se réduit-il au calcul du nombre de procédes 
permettant d’ordonner s indices. On peut le faire par s! procédés. Ainsi 
donc, en transposant le tenseur À par rapport à s indices, on peut obtenir s! 
tenseurs. Additionnons tous ces tenseurs et divisons la somme par s!. Le 
tenseur obtenu est le symétrisé du tenseur À par rapport aux indices choisis. 
On désigne ses composantes en mettant entre parenthèses les indices qui 
affectent les composantes du tenseur À. Les indices qui ne participent pas à 
la symétrisation peuvent être encadrés par des traits verticaux. 

On définit de façon analogue la symétrisation par rapport aux indices 
inférieurs. Donnons quelques exemples : 


œtilJlk) = : (œÿk + œki), 


a. eue + of, + oi, + oi, + a, + æ!,.) 
UKN 6 jkl Jlk kb kil Uyk [19 Eds 


Considérons de nouveau le tenseur À de type (p, q), avecp > 5, et choi- 
sissons s indices supérieurs quelconques. Si l’on numérote ces indices de 1 à 
s, à chaque tenseur obtenu de À par transposition correspondra une permu- 
tation o,, .…, o, des numéros 1, .., s (cela veut dire que la transposition de 
À met l’indice de numéro 0, à la première place parmi les indices choisis, 
puis elle met l’indice de numéro 0, à la deuxième, etc.). Notons N(o,, … 
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…, ©,) le nombre de perturbations de l’ordre dans la permutation o,, … 
… C$, C'est-à-dire le nombre de couples (o,,, o,) tels que a < Bet o, > 04 
(comp. p. 138). 

En transposant le tenseur À suivant les s indices choisis, on obtient s! 
tenseurs. Additionnons tous ces tenseurs en multipliant chacun d’eux préa- 
labiement par (—1) "1%, où o,, …, a. est la permutation qui lui est 
associée. Divisons la somme obtenue par s!. On dit que le tenseur ainsi 
construit est l’a/terné du tenseur À par rapport aux indices choisis. On note 
ses composantes en mettant entre crochets les indices participant à l’alter- 
nation. Exemple : 


alililk] — ; (œûk — œki), 


On définit de façon analogue une alternation relative aux indices infé- 
rieurs. Exemple : 


Donnons encore un exemple. Considérons le déterminant de la matrice 
d’une transformation linéaire. Dans le $ 4 du ch. VI on a constaté que c’est 
un invariant. Exprimons maintenant cet invariant à l’aide des opérations 
tensorielles. Soient æ' les éléments de la matrice associée à la transforma- 
tion linéaire À dans une base e. La n-ième puissance tensorielle À @ 
@ À @ .… @ A de la transformation À possède alors les composantes 
œ a? 5e ar . Alternons ce produit par rapport à tous les indices inférieurs, 
puis contractons par rapport à tous les indices. On obtient l’invariant 


a. a). 
On a ici n indices de sommation dont chacun prend n valeurs, de sorte que 
le second membre se subdivise en nr" termes. Chacun de ces termes repré- 
sente à son tour une somme algébrique de n! termes qui apparaissent par 
l’alternation. Si dans l’ensemble d’indices déterminant l’une de ces sommes 
algébriques il y a deux indices égaux, cette somme est nulle. En effet, pour 
chacun de ces termes pris avec le signe plus, il existe un terme semblable 
affecté du signe moins. Mais si dans l’ensemble d’indices qui définit la 
somme algébrique tous les indices sont différents, on peut, en permutant 
les facteurs dans chacun des termes, la réduire à la forme a, ..… a. Le 
nombre total de sommes algébriques étant n!, on a 


_ l 
À = n'ai, 7 ay] 
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En explicitant l’alternation, on obtient 


] | 
A=n! — D (— De … a? = det læ|. 
n! n 


(kikn) 


DÉFINITION. Un tenseur est dit symétrique par rapport à un couple 
d'indices s’il s’annule par alternation relative à ce couple. 

Le tenseur symétrique par rapport à un couple d’indices ne change pas 
par transposition relative à ce couple. En effet, si par exemple ji] = 0, on 
a @;; — Xi - 

Un tenseur est symétrique par rapport à un groupe d'indices s’il l’est 
pour tout couple d'indices de ce groupe. Il ne change dans ce cas par 
aucune transposition relative à ce groupe d'indices. 

Il n’est pas difficile de se convaincre que la symétrisation du tenseur par 
rapport à plusieurs indices donne un tenseur symétrique par rapport à ces 
indices. 


DÉFINITION. Ün tenseur est dit antisymétrique par rapport à un couple 
d'indices s’il devient nul par symétrisation relative à ces indices. 

Un tenseur antisymétrique par rapport à un couple d’indices change de 
signe par transposition relative à ce couple d’indices. 

" Un tenseur est antisymétrique par rapport à un groupe d'indices s’il est 
antisymétrique par rapport à tout couple d’indices de ce groupe. Dans ce 
cas, il ne varie par aucune transposition à laquelle correspond une permu- 
tation ayant un nombre pair de perturbations d’ordre, et change de signe si 
la transposition engendre une permutation ayant un nombre impair de per- 
turbations d’ordre. En effet, ces transpositions se réduisent respectivement 
à un nombre pair et impair de transpositions dont chacune permute un cou- 
ple d’indices. 

On peut démontrer que par alternation d’un tenseur par rapport à plu- 
sieurs indices, on peut le rendre antisymétrique relativement à ces indices. 
Si un tenseur est antisymétrique par rapport à deux indices, toutes ses 
composantes avec valeurs confondues de ces indices sont nulles. En effet, 


1 [LR = — ini) ; =, = 
soit par exemple “ FT Nr Dh Pour ee HE -apet ayant i, = é, 
= k, on a alors Cr = —aÿr.; et, par suite, af, = 0. 


Démontrons à titre d’exemple la proposition suivante. 


PROPOSITION 10. Chaque tenseur de type (0, 2) s'exprime de façon univo- 
que par la somme d’un tenseur symétrique et d’un tenseur antisymétrique. 


En effet, admettons qu’une telle somme existe, c’est-à-dire que æ, = 
= B; + Yi; où Bi = Det Yi) = 0. Dans ce cas, en alternant et en symétri- 
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sant les deux membres de l’égalité, on obtient respectivement 
Cr © Vin © Vo À Ci © Bin = Bj- 


D'autre part, on a toujours 


l ] 

op À Ai 5 ET 5 Gi TS LG 
c’est-à-dire 

B; + Yÿ _ ;;s 
et la proposition est démontrée. 

9. Remarque. Soit une relation entre les tenseurs exprimée à l’aide des 
opérations tensorielles introduites. Etant donné une base, on peut lui faire 
correspondre les mêmes relations entre les composantes des tenseurs consi- 
dérés. Les opérations tensorielles sont invariantes en un sens que les rela- 
tions entre les composantes sont de la même forme, quelle que soit la base. 
A savoir, la relation À = x @ y + z © z, où x, y et z sont des vecteurs, est 
équivalente à l’égalité a«Ÿ = £'n' + ÿ'{ entre les composantes, indifférem- 
ment de la nature de la base, vu que dans toutes les bases elle est de la même 
forme. 

En vertu de ce fait, lorsqu'on parle des tenseurs, on a souvent en vue 
leurs composantes et, inversement, en parlant des composantes, ôn sous- 
entend un tenseur. On dit, par exemple, « tenseur ik » au lieu de « ten- 
seur dont les composantes dans la base donnée sont a, ». On ne crée ainsi 
aucune ambiguïté et l’on simplifie fortement l’écriture. Dans la suite, on 
utilisera des abréviations de ce genre. 


$ 2. Tenseurs dans l’espace euclidien 


1. Tenseur métrique. Tout ce qui a été dit des tenseurs dans un espace 
vectoriel se rapporte évidemment au cas de l’espace euclidien. Toutefois 
dans l’espace euclidien, les tenseurs possèdent de nombreuses propriétés 
qu'ils n'avaient pas dans l’espace vectoriel. 

Le théorème 2 du $ 3, ch. VIII, peut être formulé en termes des tenseurs 
de la façon suivante : un espace euclidien de dimension n peut être défini 
comme un espace vectoriel de dimension # dans lequel est donné un tenseur 
symétrique G de composantes g;,, avec g, # > 0 pour tout vecteur £’ non 
nul. Les composantes du tenseur G dans la base e sont les éléments de la 
matrice de Gram de cette base. 


DÉFINITION. Associons à chaque base de l’espace euclidien la matrice de 
Gram de cette base. Le tenseur de type (0, 2) défini par cette correspon- 
dance s’appelle tenseur métrique de l’espace euclidien. 
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PROPOSITION 1. Faisons correspondre à chaque base de l’espace euclidien 
la matrice inverse de la matrice de Gram de cette base. Cette correspon- 
dance définit un tenseur de type (2, 0). 


DÉMONSTRATION. Soient l et T° les matrices de Gram des bases e et 
e’ =eS. Voyons comment sont liées les matrices FT! et (T')-!. On 
s’appuiera sur la formule (15) du $ 1, ch. VII : T° = 'STS. Cherchons les 
matrices inverses de T° et 'STS en nous servant de la formule (10) du $ 6, 
Ch. V : 
T')-! = S-1(ST)-! = S-!r-1(S)-!. 


Comme on l’a vu au $ 6 du ch. V, pour toute matrice de déterminant non 
nul on a ('S)-! = (S-!). Donc, 


my! = (ST) CS"). (1) 


Ecrivons la formule (1) en désignant par gŸ, g V'et Ti les éléments des matri- 
ces T-!,T')-let S-!. Il vient, 
g'Ü ” ri Tigk!, 

autrement dit, on a la loi de transformation des composantes du tenseur de 
type (2, 0). 

DÉFINITION. Le tenseur construit dans la proposition 1 s’appelle tenseur 
métrique contravariant. 

Les égalités TT-! = Eet T-IT = E peuvent être écrites au moyen des 
composantes g,; et gŸ ainsi : 


gye* = 6, 8,8 = ôf. 

En outre, vu que '(T-!) = (T)-! = l-!, le tenseur métrique contrava- 

riant est symétrique : 
gŸ = 8”. 

2. Ekvation et abaissement des indices. Le tenseur métrique permet 
d'introduire dans l’espace euclidien deux opérations sur les tenseurs : l’élé- 
vation et l’abaissement des indices. 

Abaissement de l'indice. C’est une opération qui permet, à partir d’un 
tenseur de type (p, qg), p > 1, d'obtenir un tenseur de type (p — 1,q + 1). 
Cette opération combine la multiplication du tenseur donné et du tenseur 
métrique avec la contraction par rapport à l’indice qu’on veut abaisser. 
Dans ce cas, l’ordre des indices se conserve au sens suivant. On n’observe 
plus la convention suivant laquelle chaque indice inférieur suit chaque 
indice supérieur. Pour noter l’ordre des indices on met un point au-dessus 
de chaque indice inférieur et au-dessous de chaque indice supérieur. Par 
exemple, en abaissant le premier indice du tenseur æŸ;, on obtient le ten- 


seur g,aV, = ay. 
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Elévation de l'indice. Cette opération permet, à partir d’un tenseur de 
type (p, q), d’obtenir un tenseur de type (p + 1, g — 1). Elle combine la 
multiplication du tenseur donne et du tenseur métrique contravariant avec 
la contraction relative à l’indice qu’on veut élever. Il faut bien entendu que 
le tenseur de départ ait au moins un indice inférieur, c’est-à-dire que g > 1. 
Par exemple, l’élévation du premier indice de a, donne aŸ, = g'lœÿ;, et 
l'élévation du troisième, ay* = g“læy;. - 


On a déjà rencontré l’opération d’abaissement de l’indice. 

Dans le $ 2 du ch. VII, on a introduit la notion de transformation 
linéaire adjointe A* de la transformation linéaire donnée À de l’espace 
euclidien. Dans une base arbitraire, les matrices À et A* des transforma- 
tions À et A* sont liées par l’égalité (3) du $ 2, ch. VII, qu’on peut mettre 
sous la forme l'A* = (T4). En désignant par œ et a?! les éléments des 
matrices À et A*, écrivons cette égalité en notations tensorielles : 

ko = Ba". 
Comme on le voit aisément, elle veut dire que l’abaissement des indices des 
tenseurs À et A* donne deux tenseurs dont l’un se déduit de l’autre par 
transposition. Pour une transformation symétrique À, le tenseur g, a* est 
symétrique. 

Dans le $ 3 du ch. VIII, on a introduit la notion de transformation 
linéaire À associée à la forme bilinéaire b. Dans une base arbitraire, la 
matrice À de la transformation associée s’exprime au moyen de la matrice 
B de la forme bilinéaire par l’égalité 4 = l'-!B. En notations tensorielles 
on peut l'écrire ainsi : 

a; = g*B,;. 
On voit que le tenseur À se déduit du tenseur b par élévation du premier 
indice. 

Dans le $ 1 du ch. VIII a été introduit un vecteur associé à la fonction 
linéaire sur l’espace euclidien. La matrice-ligne x des coefficients de cette 
fonction s’exprimait au moyen de la matrice-colonne æ des coordonnées du 
vecteur par la formule x = ‘el'. En passant de la représentation matricielle 
à l’écriture au moyen des composantes, on obtient x; = æ*g,.. Il en découle 
que œ = gx; (ch. VII). 


3. Tenseurs euclidiens. En etudiant les espaces euclidiens, on peut souvent se limiter aux 
scules bases orthonormées. Dans ce cas, toutes les formules contenant des produits scalaires se 
simplifient fortement car le tenseur métrique a une matrice unité 


1, i = j, 
8 = | vu (2) 
O0, 1 #j. 
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Dans tout changement de base orthonormée, la matrice de passage est orthogonale, c'est- 
à-dire satisfait à la relation S”! = !S. Cela veut dire que les éléments de S et de son inverse 
sont liés par les égalités 


d, =". (3) 


Si l'on introduit la relation (3) dans la loi de transformation des composantes du tenseur 
(4), $ 1, on obtient 


ipé k k, ! ! we 
œ.'l""p = y vis o.Pal … d af! 1 P : (4) 
J.-J l bb #1 Ja lo 
Let 
P 
li... do 
Les indices de sommation X,, … se disposent ici en haut, c'est pourquoi on écrit le 


symbole de sommation. La formule & montre qu’en se limitant aux bases orthonormées, on 
élimine la différence entre les indices supérieurs et inférieurs : aux indices supérieurs corres- 
pondent les mêmes facteurs dans la loi de transformation (4) qu'aux indices inférieurs. 

Signalons de plus qu’en vertu de (2) tous les tenseurs dont les indices diffèrent de hauteur 
ont mêmes composantes dans une base orthonormée donnée. En effet, on a, par exemple, 
A = 8x ah = œ; , vu que de ñ termes de la somme suivant # n'est différent de zéro que celui 
pour lequel i = k. Or on a pour ce dernier 8; = À, 

Il ressort de ce qu'on vient d'exposer qu’en se limitant à l'étude des bases orthonormées, 
on peut identifier tous les tenseurs déduits l’un de l’autre par élévation ou abaissement de 
l'indice. Plus précisément, tous les tenseurs qui possèdent les mêmes composantes par rapport 
à une base orthonormée sont réunis en une seule classe qu'on étudie comme un nouvel objet. 
Cet objet est le tenseur euclidien. 


DÉFINITION. On dit que dans l'espace euclidien & est défini un tenseur euclidien de 
valence 5 si à chaque base orthonormée est associée une matrice s-dimensionnelle d'ordre n. 
Ceci étant, quelles que soient les bases orthonormées e et e”, les éléments a; ,.; et a; ..; des 
matrices respectives sont liés par la relation 

: k k 
Piotr 4 a ee D QE LE (5) 
Tous les indices d’un tenseur euclidien jouent le même rôle, si bien qu'on les écrit tous en bas. 

Il découle de la formule (3) que tout tenseur de type (p, g) définit un tenseur euclidien de 
valence (p + g). Ceci étant, tous les tenseurs différant l’un de l’autre par la hauteur d’un 
indice définissent un même tenseur euclidien. 

Etant donné un tenseur euclidien, ses composantes ne sont définies dans aucune base non 
orthonormée. Mais pour tout tenseur euclidien de valence s, ces composantes peuvent être 
déterminées de manière que s’obtienne un tenseur de type (p, g), où p + q = s. Il faut pour 
cela les rechercher en utilisant la loi de transformation des composantes d’un tenseur de type 
adéquat. Ainsi, chaque tenseur euclidien est engendré par tout tenseur d’une certaine classe. Il 
en ressort facilement que tous les tenseurs de cette classe ne diffèrent que par la hauteur de 
l'indice. 

Les grandeurs numériques ne variant pas par changement de base orthonormée ont été 
appelées à la p. 248 invariants orthogonaux (ou euclidiens). On voit maintenant que ce sont 
des tenseurs euclidiens de valence 0. 

On peut définir pour les tenseurs euclidiens toutes les opérations introduites pour les ten- 
seurs au $ 1. Les définitions ainsi que les énoncés et démonstrations des propositions corres- 
pondantes reproduiront presque mot à mot ce qui a été déjà dit, aussi s’abstiendra-t-on de les 
donner. Signalons seulement que pour les tenseurs euclidiens, la contraction s'avère possible 
relativement à tout couple d'indices, et la transposition peut s'effectuer par rapport à tout 
ensemble d'indices. Par exemple, si, en se limitant aux bases orthonormées, on identifie la 


18— 6442 
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forme quadratique à la transformation qui lui est associée, le nouvel objet obtenu (le tenseur 
cuclidien de valence 2) sera invariant par contraction (comme la transformation linéaire) et 
vérifiera dans toute base orthonormeée l'égalité a, = a; (comme la forme quadratique). 


& 3. Muiltivecteurs. Invariants relatifs 


1. p-vecteurs. On débutera dans ce paragraphe par l’étude d’une classe 
spéciale de tenseurs. 


DÉFINITION. Un tenseur de type (p, 0), antisymétrique par rapport à tous 
les indices est appelé p-vecteur, ou multivecteur si p n’est pas précisé. 

Un tenseur de type (0, g), antisymétrique par rapport à tous les indices 
est appelé g-covecteur ou g-forme. 

La théorie des g-covecteurs est analogue à la théorie des multivecteurs. 
On aura affaire essentiellement aux p-vecteurs. 

Remarquons tout d’abord que pour p > nil n’existe qu’un p-vecteur 
nul. En effet, parmi p > n indices prenant les valeurs 1, ..., # deux au 
moins doivent avoir des valeurs égales. Donc, dans chaque composante il y. 
a deux indices égaux. On sait que la composante doit changer de signe dans 
la transposition du tenseur permutant ces indices. Or, comme les indices 
sont égaux, elle ne varie pas et, par suite, vaut zéro. Le raisonnement peut 
être répété pour chaque composante. 

Pour p = n, ne peuvent être différentes de zéro que les composantes 
dont les valeurs des indices constituent une permutation des nombres 1, … 
…, ñ (autrement on aurait de nouveau deux indices égaux). Toutes ces 
composantes s’expriment au moyen d’une d’entre elles par la formule 


œt"in = (— 1) V0 ET LUEUR (1) 


où N(i,,…,i,) est le nombre de perturbations de l’ordre dans la permuta- 
tion i,, .…,i, (comp. p. 138). 

En effet, on va montrer que les valeurs des indices i,, .., {, peuvent être 
rangées dans l’ordre naturel par N(i,, ..…., i,) transpositions permutant 
deux indices, et que chacune de ces transpositions modifie le signe de la 
composante. On peut ranger les valeurs des indices dans l’ordre naturel de 
la façon suivante : l’un des nombres i,, ., i, étant égal à n, déplaçons-le à 
la dernière place en le permutant successivement avec tous les nombres qui 
se trouvent à sa droite ; avec chacun de ces nombres ñn a engendré une per- 
turbation de l’ordre. On effectuera donc autant de permutations que # a 
engendré de perturbations sans changer l’ordre des autres nombres. Pre- 
nons maintenant le nombre ñ7 — 1 et déplaçons-le de la même manière à 
l’avant-dernière place. On fera ainsi autant de permutations de nombres 
pris deux à deux qu’il y a de perturbations engendrées par ñ — 1. On ne 
changera toujours pas l’ordre des autres nombres. Agissons de même avec 
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les nombres ñ7 — 2, .…, 2. Après quoi tous les nombres, dont 1 qui automa- 
tiquement prend la première place, se disposeront dans l’ordre naturel. 
Pour y arriver, on a fait N(i,, .….,i,) permutations de nombres pris deux à 
deux. . 

Un p-vecteur a!" est dit simple s’il est un produit alterné de vecteurs, 
c’est-à-dire 


aœ't-ip = el … El, (2) 


où, par exemple, £? sont les composantes du vecteur x. 
PRroPosiTion 1. Tout n-vecteur est simple. 


DÉMONSTRATION. Considérons un n-vecteur simple non nul 8" = 
= £lh... gl, Désignons par À le rapport de la composante œ-" du 
n-vecteur donné à à B'--". Il ressort te de a formule (1) qu "On à aussi pour 
toutes les composantes œ'in = Xl", En posant 7 = À£', on a 
œtin = mligh … EM, ce qu’il fallait re | 

Soient donnés p vecteurs x, , *X, de composantes £', …., Er. 

Composons la matrice dont 1és élonie sont les colonnes de coordon- 
nées des vecteurs x,, …, x, 


ë] ? 
Ho à (3) 
gr … En 


Choisissons p lignes de cette matrice de numéros i, < i, < .. < b, et cOnsi- 
dérons le mineur situé sur ces lignes : 


Mi: En y (— 1) Cr lo PE. | . Er, 


OÙ 0,,..., o, Sont tous différents et prennent les valeurs 1, …, p. En compa- 
rant cette expression à (2), on obtient les composantes du p-vecteur simple 
dont les valeurs de tous les indices sont différentes deux à deux et se dispo- 
sent dans l’ordre naturel : 


at hb _. El. | . Ep) …. Li (4) 


Les autres composantes soit s’annulent (s’il y a des indices égaux), soit dif- 
fèrent des composantes déjà trouvées par le facteur (— 1)", où N est le 
nombre de perturbations dans l’ordre des valeurs d'indices. 


18° 
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En particulier, on a pour le n-vecteur 


pre 


al..." = TT css... . (S) 
n 


Il ressort de la formule (4) que le p-vecteur simple est nul si et seulement 
si les vecteurs qui le composent sont linéairement dépendants, c’est-à-dire 
si le rang de la matrice (3) est strictement inférieur à p. 

2. Invariants relatifs. Tout n-vecteur se caractérise complètement dans 
chaque base par un nombre, sa composante @æ!-". Essayons d’écrire la loi 
de transformation de ce nombre dans un changement de base, sans faire 
intervenir les autres composantes du n-vecteur. On obtient 

œ@ ln = 7, .. cp HE = D (— DNS) . rar”, 


(TRE A) 
ou 
œ l-" = (det S=!)al--" = (det S)=!'@œl-7, (6) 


On voit que la correspondance attachant à chaque base une composante 
indépendante du n7-vecteur donné détermine un objet géométrique défini 
par une composante et régi par la loi de transformation (6). En effet, à cha- 
que base est associé un nombre unique de telle sorte que le nombre corres- 
pondant à une base s'exprime par le nombre correspondant à une autre 
base et par la matrice de passage. Cet objet n’est pas un tenseur, car un ten- 
seur à une composante est nécessairement de type (0, 0) et, partant, est un 
invariant. 

Un autre exemple d'objet géométrique de ce genre a été mentionné au 
début du $ 1 : le déterminant de la matrice des composantes d’un tenseur 
de type (0, 2) se transforme d’après la loi 


ô" = (det S}ô. (7) 


DÉFINITION. On dit qu'un invariant relatif de poids r est défini dans 
l’espace vectoriel si à chaque base on peut associer un nombre de façon que 
les nombres æ et «’ correspondant aux bases e et e” = eS soient liés par 
l'égalité 

æœ' = (det S)’ a. (8) 


Un invariant, ou invariant absolu pour souligner la différence avec un 
invariant.relatif, est un invariant relatif de poids 0. 

Par analogie à la formule (6), on peut montrer que la composante indé- 
pendante de tout n-covecteur est un invariant relatif de poids 1. 
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Mentionnons les propriétés suivantes des opérations sur les invariants 
relatifs. 


PROPOSITION 2. 1) Soient donnés deux invariants relatifs a et b d'un 
même poids r. En associant à chaque base la somme des composantes de a 
et b dans cette base, on obtient un invariant relatif de poids r. 

2) Soient donnés les invariants relatifs a et b de poids respectifs r, et r,. 
En associant à chaque base le produit des composantes de a et b dans cette 
base, on obtient un invariant relatif de poids r, + r,. 

3) Soit un invariant relatif a de poids r. En associant à chaque base la 
p-ième puissance de la composante de a dans cette base, on obtient un inva- 
riant relatif de poids pr. 


Les trois assertions se démontrent de la même façon. Démontrons à 
titre d’exemple la deuxième. En multipliant les égalités (8) écrites pour a et 
b, on obtient la relation 


ab’ = (det S)1*"2ab 


entre les produits des composantes de a et b dans deux bases quelconques e 
ete”, ou la loi de transformation recherchée. 

On peut maintenant s’assurer qu’il existe des invariants relatifs de tout 
poids r. Pour construire un invariant relatif de poids r, il suffit d’élever à la 
puissance r un invariant relatif quelconque de poids 1. 

3. Volume d’un parallélépipède 7-dimensionnel. Considérons dans un 
espace tridimensionnel ordinaire un parallélépipède engendré par les vec- 
teurs x,, x, et x, issus de l’origine des coordonnées. II peut être défini 
comme un ensemble des vecteurs de la forme a = À,x, + À x, + Àx,, 
ave OSA <I1,0<AR <IeR0<XR I. La formule (10) du $ 3, ch. I, 
fournit le volume du parallélépipède, qui est égal à la valeur absolue du 
déterminant 


£] E E 
# & & 
#5 & E 


construit avec les composantes des vecteurs x,, x, et x, dans une base ortho- 
normée. Ce déterminant est égal au produit de 3! par la composante du 
3-vecteur engendré par ces vecteurs, dont les indices sont 1, 2 et 3. 


DÉFINITION. Etant donné un espace vectoriel de dimension n, on appelle 
parallélépipède p-dimensionnel *) l’ensemble de tous les vecteurs de la 
forme a = À,x, + .… + À x, où x, …., X, SONT des vecteurs lineairement 
indépendants donnés, et 0 < À, < 1 pour tous les a = 1, ..…, p. 


*) On utilise de même le mot « parallélotope ». 
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DÉFINITION. Soit le parallélépipède 7-dimensionnel P construit sur les 
vecteurs x,, …, x, dans un espace euclidien de dimension n. Si £;, …, Er 
sont les composantes de ces vecteurs dans une base orthonormée, on appel- 
lera volume du parallélépipède #7 dimensionnel le nombre 


V(P) = n! lg gl, (9) 


c’est-à-dire le produit de 7! par le module de la composante du n-vecteur 
engendré par les vecteurs x,, …, x,, dont les indices sont 1, ..., n. 

On ne précise pas dans la définition de quelle base orthonormée il 
s’agit. Aussi doit-on démontrer que V(P) ne dépend pas du choix de la 
base orthonormée. Selon la formule (6), le passage d’une base orthonor- 
mée e à la base e” = eS entraîne V'(P) = Idet S-!1 F(P).Sie’ est ortho- 
normée, la matrice S - ! est orthogonale et idet S-!|1 = 1, ce qui démontre 
l’assertion. 

On voit que V(P) est un invariant orthogonal, c’est-à-dire un tenseur 
euclidien de valence 0 (voir p. 248). 

Proposons-nous d'obtenir l’expression du volume du parallélépipède 
n-dimensionnel dans une base arbitraire. Remarquons pour cela que selon 
la formule (7), le déterminant de la matrice du tenseur métrique det T est 
un invariant relatif de poids 2. En outre, on a toujours det l > 0 (proposi- 
tion 3, $ 1, ch. VII). Aussi peut-on envisager la quantité Vdet T qu’on doit 
évidemment multiplier par Îdet Si quand on change de base. Le produit 
n!vdet T IE(! … £71l est un invariant absolu. Or dans un base orthonor- 
mée, det | = 1, de sorte que, dans cette base on a 


V(P) = n!vdet T'I£[! … gril. (10) 


Le premier membre de l’égalité est un invariant et, par suite, l’égalité (10) 
est vérifiée dans toute base. 


CHAPITRE XI 


APPLICATIONS LINÉAIRES 


$ 1. Application adjointe 


On sait que dans un espace euclidien, toute transformation linéaire À 
admet une transformation adjointe A°. La même notation avec astérisque 
a été utilisée pour l’espace vectoriel .° dual de l’espace vectoriel donné .Z 
qui est l’ensemble des fonctions linéaires définies sur. Cette ressemblance 
de notations traduit un lien profond entre les notions mentionnées. Dans ce 
paragraphe, on décrira ce lien de façon plus‘détaillée. L’objet de ce para- 
graphe est de définir et d’étudier une application adjointe de l’application 
linéaire donnée d’un espace vectoriel dans l’autre. 

*1. Orthogonalité. Introduisons quelques notations et notions pour les 
fonctions linéaires sur un espace vectoriel .#. Elles vont rappeller le lien 
existant entre les fonctions linéaires et les vecteurs d’un espace euclidien et 
simplifier les énoncés de certaines propositions. 

Considérons une fonction linéaire f définie sur l’espace vectoriel .#. La 
valeur de la fonction / sur le vecteur x sera noté jf, x) et non pas f(x). 
Cette notation paraît plus symétrique pour j et x. 

On sait que le vecteur x e .Z peut être interprété comme une fonction 
linéaire sur .2*, faisant correspondre à tout f de Æ* un nombre 
(/,x) *). Puisque la valeur de f sur x et la valeur de x sur f'est un même 
nombre, on est en droit d’écrire (f,x) = (x,f). 

Le vecteur x e .Z sera dit orthogonal au vecteur f de #° si (f,x) = 
= 0. Notons que la notion de bases biorthogonales suppose une orthogo- 
nalité considérée dans ce sens-là. Il est évident que la relation d’orthogona- 
lité est symétrique : j est orthogonal à x si et seulement si x est orthogonal 


à J. 


DÉFINITION. Soit .&, un sous-espace vectoriel dans 7. L'ensemble de 
tous les vecteurs de LL orthogonaux à tout vecteur de .#, est appelé 
l’orthogonal de #, et est noté 41. 

Soulignons que l’orthogonal d’un sous-espace de .Æ se trouve dans un 
autre espace, l’espace 4” . 


+) Pour le lecteur initié à l’algèbre tensoriel, il est peut-être utile de noter que ( J, x ) est 
le produit contracté du vecteur x et du covecteur /. 


280 APPLICATIONS LINÉAIRES [CH.XI 


PROPOSITION 1. L'orthogonal du sous-espace k-dimensionnel #4, est un 
sous-espace vectoriel avec dim .#,+ = n — Kk. 


La démonstration ne diffère presque pas de celle de la proposition ana- 
logue énoncée pour l’espace euclidien. Remarquons d’abord que fe .#,* si 
et seulement si f est orthogonal à tous les vecteurs d’une base quelconque 
dans #,. En effet, si Îla,, .…., a, Î est une base dans .# , pour tout x de .#, 
onax = £la + … + £fa,, de sorte que (f,x) = El (f,a ) + … 

. + EF (JS, a, > en vertu de la linéarité de la fonction f. Par conséquent, 
si (f,a,) = 0,..., (f,a, > = 0,ona (/f,x) = 0. Inversement, si 
{ f,x) = Opourtousles x e .#, , il en est de même en particulier pour les 
vecteurs de base. 

L'espace # étant rapporté à une base, on est en mesure d’exprimer en 
coordonnées les égalités <f,a,> = 0 pour tous les i = 1, ..., &. On obtient 
un système d’équations linéaires 


X,al + … + x, a? = 0, 
| = 
X, + ..e + X,@+ on 0 


par rapport aux coefficients de la fonction f dans la base choisie. a}, .., œ” 
désignent les composantes du vecteur a. Vu que les vecteurs a,,.…, a, sont 
linéairement indépendants, le rang de la matrice du système vaut £. On sait 
que l’ensemble des solutions du système a une structure d’un espace vecto- 
riel de dimension 7 — k, ce qui équivaut à l’assertion qu'il fallait démon- 
trer. 

Considérons pour un sous-espace .#, l’espace (.#,:)1 qui est l’ortho- 
gonal de son orthogonal. La relation d’orthogonalité étant inversible, il 
s'ensuit que .#, © (./,:)*. Or la dimension de (.#,+)* est égale à n — 
— (n — k) = k. Cela Sonifie que (.#,+)! se confond avec #4, . 

2. Définition de l’application adjointe. Considérons deux Spaces vec- 
toriels et 7 de dimensions n et m, en général, différentes. /* et 7 * 
désignent comme d’habitude les espaces duals correspondants. Soit donnée 
une application linéaire À : # —  . 

Si fe Z* est une fonction linéaire sur J., on est en mesure de définir 
le produit de l’application À par cette fonction, c’est-à-dire d’agir d’abord 
sur le vecteur x € <, par l'application A et, ensuite, de prendre la valeur de 
la fonction j sur le vecteur A(x)€e A On définit ainsi une fonction numé- 
rique g sur l’espace Æ, qui peut être notée j o À. Ainsi donc, 


(g,x>) = (fo A)x) = (f,A(x)). (1) 


La fonction f peut être interprétée comme une application linéaire de 
dans l’ensemble de nombres et, par suite, g est linéaire en tant que produit 
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de deux applications linéaires. D'ailleurs, la linéarité de g peut être vérifiée 
directement. 

Associons maintenant à chaque fonction f sur 7, une fonction f © À 
sur À et notons A* une application ainsi obtenue de” dans_Z*. Ainsi, 


A°(N) =f°A. (2) 


Considérons la valeur de chacun des membres de l'égalité (2) sur le vecteur 
x. Il vient, 


(A°(),x) = ( f, A(x)). (3) 


L'égalité (3) ressemble beaucoup à la definition de la transformation 
adjointe dans l’espace euclidien. On montrera plus loin que ce n’est pas 
seulement une ressemblance. Remarquons que la ressemblance des expres- 
sions à été obtenue grâce aux notations convenablement choisies. Si la 
valeur de la fonction était notée f(x), le second membre de l’égalité (3) 
aurait dû être écrit ainsi : f(A(x)), et le premier membre, sous une forme 
absolument incommode : A° (f(x). 

Démontrons que l’application AÀ° est linéaire. A cet effet, rappelons les 
définitions de la somme de deux fonctions linéaires et du produit d’une 
fonction linéaire par un nombre. Dans les nouvelles notations, ces défini- 
tions prennent la forme 


(f +f,x) = (J,,x) + CJ,,x), 
(af,x) = at(f,x). 
En se servant de ces égalités et de l'égalité (3), on peut écrire 
CA +8),x) = Cf +R, AG) = Cf, A) + Cf, AR) = 
= (A°(J/,),x) + CA°(Z),x) = ( A°(,) + A° CZ), x) 
et 
(A*(af},x) = (af, A(x)) = a{ f, A(x)) = a(A°(),x), 


ce qu’il fallait démontrer. On peut maintenant introduire la définition sui- 
vante. 

DÉFINITION. L’application linéaire A° : 7° — _Z* définie par la for- 
mule (2) est dite adjointe de l’application linéaire À : 7 — 7. 

On aurait pu interpréter la formule (3) comme une définition en exi- 
geant que l'égalité soit vérifiée pour tout x e À. 

I] ressort de ce qui vient d’être dit que toute application linéaire admet 
une application adjointe et une seule. 

Considérons l’application adjointe A** de l’application A°. Sélon la 
définition, A * * applique Z dans ,. Ceci étant, si l’on interprète x e , 
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comme une fonction linéaire sur “*, on obtient pour tout fe 7° l’égalité 
suivante 


CA**(x),f) = (x, A°(N). 


Comme il a été indiqué plus haut, on peut mettre cette égalité sous une 
autre forme : 


(JS, A°°(x))> = CA° (SN), x), 
d’où on obtient, en appliquant la définition à A°, que 
CS, A°°(x)) = (J, A(x)). 


Puisque cette égalité est vérifiée pour tout fe *, les vecteurs A ° * (x) et 
A(x), considérés comme des fonctions sur 1, doivent coïncider. Leur 
coïncidence pour tous les x e /,, signifie que 


A°° = À. 


3. Expression analytique. Rapportons les espaces /,, et A aux bases 
respectives e = Île,, .…,e,l et! = H,,...,/,1. L'image du vecteur xe 4 
par l'application À se définit alors dans la base / par la colonne de coordon- 
nées 


9 = AË, 


où £ est la colonne de coordonnées de x par rapport à la base e, et À la 
matrice de l'application À par rapport aux bases choisies. Considérons une 
fonction linéaire f sur F2 et désignons la matrice-ligne de ses coefficients 
dans la base / par x = Îx,, .…, x, ll. La valeur de la fonction fe A sur le vec- 
teur x est alors 


(JS, A(xX)) = = x AE, 


de sorte que la fonction A° (f) = foA se définit dans la base e par la 
matrice-ligne de coordonnées 


BR = XA. (4) 


Il reste à se rappeler que les coefficients de la fonction linéaire dans une 
base sont ses coordonnées par rapport à la base de l’espace dual, biortho- 
gonale à la base donnée. Si l’on écrit les coordonnées du vecteur de l’espace 
dual sous forme de matrice-colonne, la formule (4) devient ‘gp = 
= ‘A!x. Il s'ensuit la 


PROPOSITION 2. Si À est la matrice de l'application À :_Z, — 7, par rap- 
port à un couple de bases données, la matrice transpcsée ‘A est celle de 
l'application adjointe A° :_7* — _£* par rapport à un couple de bases bi- 
orthogonales. 
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Si l’on s’en tient au point de vue matriciel, on pourrait dire que la 
matrice À de type (m1, ñn), traitée comme matrice d’une application, peut 
être utilisée de deux façons : 

1) On peut la multiplier à droite par une matrice-colonne à nr éléments 
et obtenir une matrice-colonne à m éléments. On définit ainsi une applica- 
tion À de l’espace des matrices-colonnes à nr éléments dans l’espace des 
matrices-colonnes à m7 éléments. 

2) On peut la multiplier à gauche par une matrice-ligne à m éléments et 
obtenir une matrice-ligne à n éléments. On définit par là-même une appli- 
cation A° de l’espace des matrices-lignes à m éléments dans l’espace des 
matrices-lignes à nr éléments. 

4. Propriétés des applications adjointes. Le passage à l’application 
adjointe est lié de la façon suivante aux opérations algébriques sur les 
applications. 


PROPOSITION 3. Si les applications BA, À“! ou À + B sont définies, on a 
respectivement 


(BA)* = A°B*, (5) 
(A71)* = (A°)°", (6) 
(A + B)* = A° +B°, (7) 
(@A)* = «A*. (8) 


Pour démontrer la formule (5), considérons trois espaces vectoriels 
et F et les applications À : /— /e«B : 7 — 7. Si_Z et _f sont rap- 
portés respectivement aux bases e, / et h, la matrice de l’application B o A 
par rapport au couple de bases e et h est égale à BA, où À est la matrice de 
A par rapport aux bases e, Jet B, la matrice de B par rapport aux bases /, h. 
On sait que (BA) = ‘A!B pour toutes matrices À et B dont le produit BA 
est défini. Il s’ensuit que la matrice de l’application (B°A)* par rapport 
aux bases biorthogonales h et e est A'!B et, par suite, (B ° A)" est égale au 
produit A° B°. La formule (5) est donc démontrée. 

Si l'application À est inversible et À est sa matrice par rapport aux bases 
e et [, l'application inverse A7! possède la matrice À -! par rapport aux 
bases / et e. Vu que (‘4)-! = ‘(A -!), l’application adjointe A° est égale- 
ment inversible et sa matrice est ‘(4 —!). 

On ne s'arrêtera pas à la démonstration des formules (7) et (8). Elles 
découlent facilement de l’expression analytique des applications. 

Rappelons qu’on appelle noyau de l’application À l’ensemble des vec- 
teurs x tels que A(x) = o. On désigne le noyau de A par le symbole Ker A. 
En utilisant la proposition 2 du $ 3, ch. VI, on démontre facilement que 
Ker À est un sous-espace vectoriel dans #. 
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PROPOSITION 4. L 'orthogonal de l’ensemble des valeurs de l'application 
À se confond avec le noyau de son application adjointe : 


(A(Z)): = Ker A°. (9) 


Le noyau Ker A° de l’application A° est par définition composé de 
tous les vecteurs f € de tels que A° (f) = o. Cela signifie que la relation 
f e Ker A° est équivalente à l'égalité ( A° (f), x) = 0 pour tout x e À, 
qui, à son tour, est équivalente à { f, A(x))> = 0. Or l’orthogonal du 
sous-espace A(./) est justement l’ensemble de tous les f e .2° tels que 

Cf, A(x)) = 0 pour tout x € SZ. 


COROLLAIRE. En appliquant la proposition 4 à l'application A° on 
obtient 


A° (2°) = (Ker A). 


Exprimée en coordonnées, la proposition 4 se réduit au théorème de 
Fredholm sur la compatibilité des systèmes d’équations linéaires. Rappe- 
lons son énonce. 


THÉORÈME DE FREDHOLM. Un système de m équations linéaires à n incon- 
nues A = b est compatible si et seulement si toute solution du système 
homogène transposé ‘An = 0 satisfait à la condition nb = 0. 


Considérons deux espaces 7 et 7, dont chacun est rapporté à une 
base. Chaque matrice-colonne dans l’énoncé du théorème sera assimilée à 
une colonne de coordonnées d’un certain vecteur, et la matrice du système 
A à la matrice de l’application linéaire A. La compatibilité du système 
AE = b signifie que b e A(.%). L'ensemble des solutions du système 
homogène transposée est Ker ÀA°. Ceci noté, on constate facilement que 
l’assertion du théorème de Fredhoim s’écrit à l’aide de la formule (9). 


PROPOSITION 5. Rg A° = Reg A. 


Cela résulte directement de la proposition 2. Cependant, on recom- 
mande au lecteur de déduire cette proposition à titre d'exercice, en compa- 
rant les dimensions des deux membres de l’égalite (9). 

5. Transformation adjointe. On a défini plus haut une application 
adjointe pour toute application linéaire d’ùn espace vectoriel dans l’autre. 
Considérons maintenant l’application adjointe d’une transformation A : 
Z, — L, c'est-à-dire d’une application pour laquelle les espaces .5f et.#}, 
coïncident. Dans ce cas, les espaces Z* et .2* se confondent de même et 
l’application adjointe est une transformation de l’espace 2 . Ainsi, deux 
transformations adjointes À et A° opèrent dans deux espaces duals .# et 

Rappelons que la matrice de l’application A : 2 — 7, est définie 
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quand sont choisies les bases : e dans Z et / dans .Z7,. Dans le cas d’une 
transformation, les bases e et / doivent par définition coïncider : la matrice 
de la transformation À par rapport à la base e est composée des coordon- 
nées des vecteurs À (e,), .…, A(e,) par rapport à e. Cette définition prise en 
compte, on obtient la 


PROPOSITION 6. Si À est la matrice de la transformation À par rapport à 
la base e , 'A est celle de la transformation adjointe A° par rapport à la base 
p biorthogonale à e. 


Pour les transformations linéaires, à la différence d’applications linéai- 
res quelconques, on peut définir les sous-espaces invariants, les valeurs 
propres et les vecteurs propres. Etudions comment ils sont liés pour une 
transformation À et son adjoint A*. 

Le polynôme caractéristique ne varie pas par transposition de la matri- 
ce : det (A — ÀE) = det (4 — ÀE). De plus, Rg(4 — ÀE) = 
= Rg (!4 — XE), de sorte que la proposition 6 entraîne la 


ProPosrrion 7. Les valeurs propres des transformations À et A° se con- 
fondent, et les valeurs propres égales sont de même multiplicité. Si à une 
valeur propre X de la transformation À sont associés k vecteurs linéaire- 
ment indépendants, il en est de même pour la transformation À*. 


PROPOSITION 8. Si un sous-espace #& € Z, est invariant pdr la transfor- 
mation À, son orthogonal &+ © .£* est invariant par la transformation 
A°. 

DÉMONSTRATION. Soit x e .#. Alors A(x) € # et tout vecteur f € 
€ LH! vérifie la relation ( f, A(x)) = 0. Or cela signifie que 
{A°(PN),x) = ODet, par suite, A (NE. *. 


PROPOSITION 9. Soient x et f les vecteurs propres des transformations res- 
pectives À et ÀA° associés aux valeurs propres X et u. Si X\ # u, les vecteurs x 
et f sont orthogonaux. 


En effet, soit 
A(x) = Àx, x, A(x)e Z, 


et 
A'N=nf, fAMNES". 
Considérons la valeur de la fonction linéaire f sur le vecteur A(x). On a 
(JS, A(X)) = CA ON, x) = nf, x). 
Or (J, A(x)) = X(J, x}. Donc, 
GA —-w{(Jf,x) = 0, 


ce qui démontre la proposition 
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PROPOSITION 10. Si la base e est composée des vecteurs propres de la 
transformation À, la base biorthogonale à e est composée des vecteurs pro- 
pres de la transformation À*. 


Pour le démontrer, il suffit de se rappeler que la matrice de la transfor- 
mation À est diagonale par rapport à la base e. Par suite, est diagonale sa 
matrice transposée. Or c’est la matrice de la transformation A° par rapport 
à la base biorthogonale à e. : 

6. Cas d’espaces euclidiens. Soient & et &, des espaces euclidiens de 
dimensions respectives nr et m. Considérons une application linéaire À : 
4, — 4, et son application adjointe A°. La propriété essentielle pour nous 
de l’espace euclidien est qu’il peut être identifié avec son espace dual (voir 
point 4, $ 1, ch. VIII). L : 

Ainsi, pour toute application À : & — €, son adjointe A° applique &, 
dans &° et peut être définie par l’égalité 


(A° ©), x) = ©, AGx)), (10) 


qui doit être vérifiée pour tous vecteurs x e & et y e &,. Les parenthèses 
intervenant dans le premier et le second membre de l’égalité (10) renfer- 
ment le produit scalaire respectivement dans € et dans &,. Dans la suite, 
on s’abstiendra de telles indications en admettant que l’appartenance des 
facteurs à un espace permet de comprendre que l’opération de multiplica- 
tion scalaire est envisagée dans cet espace (comme c’est admis pour le 
signe +). 

Remarquons que si À est une transformation dans l’espace &, son 
adjointe A° est aussi une transformation dans €, et la définition (10) 
coïncide avec la définition connue de la transformation adjointe dans un 
espace euclidien. _ 

Exprimons la formule (10) sous forme analytique. Rapportons & et &, 
à deux bases quelconques et désignons par £ et # les colonnes de coordon- 
nées des vecteurs xe “ et ye &,. Soient À et À * les matrices des applica- 
tions À et A°, et let Î'les matrices de Gram des bases choisies. L'égalité 
(10) prend alors la forme 


(A * a)TE = aTAE. 
Les matrices £ et # étant arbitraires, il s'ensuit que 
(A°)r = ÎA, 
ou 
A* =(T-!}A)E (11) 


Cette expression est beaucoup plus compliquée que la relation entre les 
matrices, mentionnée dans la proposition 6. On l’explique par le fait qu’en 
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indentifiant & à &° et 4 à <.*, on choisit dans les espaces identifiés une 
même base et non pas deux bases biorthogonales. Si la base est orthonor- 
mée, elle coïncide avec sa base biorthogonale. Pour les bases orthonor- 
mées, (11) devient 4° = ‘4, ce qui est conforme à la proposition 6. 

Comparé au cas général étudié dans les points précédents le cas d’espa- 
ces euclidiens contient un fait nouveau : en identifiant # à 4° et é à 
€,°, on définit par là même les produits A° A et AA°. Le premier d’entre 
eux est une transformation de l’espace “, et le second, de l’espace é” ,,. Les 
propriétés de ces transformations sont semblables. En effet, la transforma- 
tion AA° peut être exprimée sous la forme (A° )° (A° ) et, par suite, la 
seconde des transformations se confond avec la première, prise pour 
l'application À°. Etudions les propiétés de A° A. 

Le rôle principal dans cette étude revient à la relation évidente sui- 
vante : 


(A° A(x), x) = (A(x), A(x)) 2 0, (12) 
qui s’annule si et seulement si A(x) = o. 


PROPOSITION 11. La transformation À° À est symétrique. Ses valeurs 
propres sont positives. 


En effet, selon la proposition 3, (A° A)° = A°A°° = A°A, ce qui 
démontre la première assertion. Posons AÀ°A(x) = Àx. Alors 
(A° A(x), x) = À(x, x) > 0 en vertu de l’égalité (12). D’où À > 0. 


PROPOSITION 12. Le noyau de la transformation À° À se confond avec le 
noyau de l'application À. L'ensemble des valeurs de À° À coïncide avec 
celui de À". 


DÉMONSTRATION. A(x) = o entraîne A° A(x) = o et, par suite, Ker À Ç 
C Ker A° A. Par ailleurs, A° A(x) = o entraîne (A° A(x), x) = Det, en 
vertu de (12), A(x) = o. Donc, Ker A° À © Ker À, ce qui démontre 
l’assertion 


Ker À = Ker A° À. (13) 


Pour démontrer la seconde assertion, comparons les rangs de À et de 
A° À, ce qui présente un intérêt en soi. On sait que la somme du rang d’une 
application et de la dimension de son noyau vaut la dimension de l’espace 
appliqué. L'espace é, est le même pour les applications À et A° À, et leurs 
noyaux se confondent. Par suite, 


Rg A° A = Re À. (14) 
Ensuite, puisque A(<) € <, ilest évident que A° A(£) € A°(&,). De 


par la définition du rang d’une application on a Rg À = Rg A° = 
= dim ÀA°(€,) et Rg A° À = dim A° A(%). Les rangs étant égaux, les 
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sous-espaces se confondent en vertu de l’inclusion mentionnée plus haut et 
de l’égalité des dimensions : 


A° A(4) = A° (4). 


La proposition est démontrée. 

Dans un espace euclidien, à toute transformation symétrique B on asso- 
cie une forme quadratique (B(x), x). De la proposition 11 découle le corol- 
laire suivant. 


CoroLLAIRE. La forme quadratique (A*° A(x), x) est semi-définie posi- 
tive. Elle est définie positive si et seulement si Ker À = o. 


On sait que Rg À = Rg A°. D'où, en appliquant la formule (14) à 
l'application A°, on obtient 


Rg A° A = Rg AA*°. (15) 


Etudions les relations entre les vecteurs propres et les valeurs propres 
des transformations A° À et AA°*. Elles s’expriment par la proposition sui- 
vante. 


PROPOSITION 13. Si x est un vecteur propre de la transformation A° À 
associé à la valeur propre X Æ 0, A(x) est un vecteur propre de la transfor- 
mation AA”, associé à la même valeur propre. De plus, aux vecteurs pro- 
pres linéairement indépendants x, , …, x, de la transformation À* À corres- 
pondent les vecteurs propres linéairement indépendants A(x;,), …, A(x,) de 
la transformation AA*. 


DÉMONSTRATION. Soit AÀ° A(x) = Àx. Considérons les images par 
l’application À des deux membres de cette équation, soit : (AA® )A(x) = 
= XA(x). Si À # 0, on a A* A(x) # o et, par suite, A(x) # o. Dans ce cas, 
A(x) est un vecteur propre de AA*, associé à la valeur X. 

Considérons ensuite les vecteurs propres linéairement indépendants 
X,, …, X, de la transformation A° À, associés aux valeurs propres non nul- 
les À,, .…, À, dont quelques-unes peuvent être égales. Supposons que 
les vecteurs A(x,), …, A(x,) sont linéairement dépendants et que 
@, A(x,) + .… + æ,A(x,) est leur combinaison linéaire non triviale égale à 
zéro. Considérons l’image de cette dernière par l’application AÀ°. Il vient 


a, A° A(X,) + … + a, À° A(x,) = a, AÀ,x, + .…. + a, À X, = 0, 


ce qui contredit l’indépendance linéaire des vecteurs x,, ..,x, car À,,..., À 
sont non nuls. La proposition est démontrée. 

Vu que pour les transformations symétriques le nombre maximal de 
vecteurs propres linéairement indépendants associés à la valeur propre X est 
égal à sa multiplicité, on obtient le 
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CoroLLAIRE. Les valeurs propres non nulles des transformations A° A 
et AA° coincident, et de plus les valeurs propres égales sont de même multi- 
plicité. 

REMARQUE. La présence de la valeur propre nulle et sa multiplicité se 
déterminent pour les transformations A° À et AA° d’après les dimensions 
de Ker A et Ker À*° respectivement. 

7. Bases singulières d’une application. Considérons une application A : 


é — €, où é, et <, sont deux espaces euclidiens. 


DÉFINITION. On appelle première base singulière de l'application À une 
base orthonormée dans <,, composée des vecteurs propres de la transfor- 
mation À* À, ordonnés de manière que les valeurs propres correspondantes 
forment une suite décroissante : À, > … > N, 

Ainsi donc, sir = Rg À,ona À, > 0 pour i & r,et À; = Opourj > r. 
Soit lle,, …, e, Il la première base singulière de A. Alors 


(A(e:.), A(e;)) = (A° A(e,), e;) = À,(e,, e;). 
Il s'ensuit que les vecteurs A(e,) sont deux à deux orthogonaux et 
lA(e,)1 = VX,, (16) 

ce qui signifie que A(e.) # o pour i < r, et Â(e,) = o pour i > r *). 

DÉFINITION. Les nombres a, = VX, où À, sont les valeurs propres de la 
transformation A° À, s appellent nombres singuliers de l'application À, 
ainsi que nombres singuliers de la matrice de cette application par rapport à 
toute base. 

Selon (16), les vecteurs ær 1 A(e,) constituent pour i < r un système 


orthonormé dans “,. Complétons-le jusqu’à une base orthonormée f dans 
ke et introduisons fa définition qui suit. 


DÉFINITION. On appelle seconde base singulière de l’application À une 
base orthonormée f dans “, dont les r premiers vecteurs sont de la forme 
ar! A(e.), i = 1,...,r, où lle,, .…,e, l est la première base singulière et r = 
= Rg A. 

I1 découle de la définition que les bases singulières ne sont pas définies 
de façon univoque. 


THÉORÈME 1. Rapportée à un couple de bases singulières de l'application 
À, la matrice de cette application est de la forme 


D, O 
a=[?. ; 7 
O O # 


*) Voir proposition 12. 
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où D, est la matrice diagonale carrée d'ordre r avec les nombres a; sur la 
diagonale, les autres éléments de À étant nuls. 


DEMONSTRATION. Par définition, les colonnes de À sont les matrices- 
colonnes des coordonnées des vecteurs A(e,) par rapport à la base f. Il res- 
sort de (16) que les 7 — r dernières colonnes de la matrice À sont nulles. La 
définition de f entraîne que A(e,) = af. pour i < r. Ce qui achève la 
démonstration. : 

Rappelons que dans tout changement de bases dans les espaces “, et 
la matrice de l’application se transforme suivant la formule 4 = P-!A4Q, 
où P et Q sont des matrices de passage. Si les bases de départ sont ortho- 
normées, les matrices de passage aux bases singulières seront orthogonales. 
Aussi peut-on exprimer le théorème 1 en termes de matrices de la façon sui- 
vante : 


THEOREME 1M. Pour toute matrice À de type (m, n) il existe deux matri- 
ces orthogonales U et V telles que la matrice UA V soit de la forme (17). 


Un énoncé équivalent est souvent fort utile : 
Toute matrice À de type (m, n) peut être décomposée en produit 


A = ODP, (18) 


où Qet P sont des matrices orthogonales et D une matrice de la forme (17). 
Cette décomposition porte le nom de décomposition singulière d’une 
matrice. 

Le théorème 1 est complété par le 


THEOREME 2. Supposons que la matrice À de l'application À par rapport 
à un couple de bases orthonormées soit représentée sous forme de produit 
(18) er que les nombres a; sur la diagonale de la matrice D se disposent dans 
l’ordre des valeurs décroissantes. Les colonnes des matrices !‘P et Q sont 
alors les colonnes de coordonnées des vecteurs de la première et de la 
seconde base singulière de À respectivement. Les r premiers nombres singu- 
liers de À sont égaux à a,,i = 1,...,r, et les n — r autres sont nuls. 


DÉMONSTRATION. Considérons une colonne p, de la matrice ‘P. La 
matrice P étant orthogonale, il vient 


AAp, = ‘P'DDPp, = ‘P'DDe,, 
où £, est une colonne de la matrice unité d’ordre n. La matrice ‘DD est une 


matrice diagonale carrée d’ordre n# dont les r premiers éléments diagonaux 
sont a”, et les autres sont nuls. Il en ressort que pour i £< rona 


AAp,; = "PE; = ap; 


et 'AAp, = 0 pour i > r. Donc, p,,i = 1,..., n, sont les matrices-colonnes 
de coordonnées des vecteurs propres de la transformation A* A. On a ainsi 
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démontré l’assertion concernant la première base singulière et les nombres 
singuliers. 
Ensuite, ‘ 


Ap; = QDPp, = QDe.. 


Soit £, une colonne de la matrice unité d’ordre m. Le produit De, est égal à 
a;€; pour i < r, et à zéro dans les autres cas. On a donc pour tous les ÿ = 
= ls 


AP; = a; QE; = @;g;;, 


où g,; est une colonne de la matrice Q, ce qui achève la démonstration du 
théorème. 

Si la matrice de l’application À par rapport à un couple de bases ortho- 
normées est représentée sous la forme (18), la matrice de l’application 
adjointe A“ est 


tA = (P'D'Q, 
ce qui entraîne la 


PROPOSITION 14. Soient e = Île,, .…., e,ll et f = Mf,, .…, f,, la première 
et la seconde base singulière de l'application À. Alors f est la première et e 
la seconde base singulière de l'application À*. Les nombres singuliers non 
nuls des applications À et À* coïncident. 


Admettons que l’application À est inversible et que sa matrice par rap- 
port à un couple de bases orthonormées se décompose en produit (18). 
Alors la matrice de l’application A”! est 


AT = P="D°0" _ (P(D-!)'Q, 
et l’on aboutit à la proposition suivante. 


PROPOSITION 15. Supposons que l’application À est inversible et que e et 
f sont ses première et seconde bases singulières. Dans ce cas, les bases e et f 
diffèrent respectivement de la seconde et de la première base singulière de 
l'application A” par l’ordre des vecteurs au plus. Si a,, i = 1, .….,n, sont 
des nombres singuliers de À, «7! sont des nombres singuliers de A. 


8. Généralisation aux espaces complexes. Dans le cas d’espaces com- 
plexes, on peut définir une application adjointe de la même façon qu’on l’a 
fait au point 2, et concerver par là même toutes les propriétés de cette appli- 
cation énoncées aux points 2 à 5. Cela est dü au fait qu’on n’y a pas exigé 
que l’espace vectoriel soit réel. Toutefois la relation qui existe entre l’appli- 
cation adjointe et le produit scalaire dans les espaces euclidiens ne se géné- 
ralise pas directement aux espaces unitaires. (Cette relation peut être repor- 
tée aux espaces euclidiens complexes, mais leur intérêt est minime.) 
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Pour que la relation entre l’application adjointe et le produit scalaire se 
maintienne pour les espaces unitaires, il faut modifier la définition de 
l’espace dual, à quoi on va justement procéder. Considérons un espace vec- 
toriel complexe .Æ et introduisons la définition suivante. 


DÉFINITION. La fonction sur & est dite semi-linéaire (ou hermitienne 
linéaire) si pour tous x, y e £ elle satisfait aux conditions 


CI, x + y) CI,Xx) + (Sy), 
(f, ax) = a(f,x), 


où a est le nombre complexe conjugué de &, et ( f, x > la valeur de f sur le 
vecteur x. 

Cette définition permet d'exprimer < f,x } au moyen des composantes 
de x dans une base e = lle,, .., e  : | 


CPx) = Y'xbi= xt, 


Î 


où £ est la matrice-colonne conjuguée de la colonne de coordonnées du vec- 
teur x, et x la matrice-ligne des coefficients de la fonction f, avec, comme 
dans le cas d’une fonction linéaire, x, = « f, e, ). 

Définissons, comme pour les fonctions linéaires, l’addition de deux 
fonctions semi-linéaires et la multiplication d’une fonction semi-linéaire 
par un nombre au moyen des égalités suivantes : 


(f +f,Xx) = (J,,Xx) + CS,,x), 
(af,x) = a(f,x). 


Il est facile de vérifier qu’en vertu d’une telle définition d’opérations 
linéaires, l’ensemble de toutes les fonctions semi-linéaires sur un espace 
vectoriel complexe Æ de dimension 7 est aussi un espace vectoriel com- 
plexe de dimension n. C’est cet espace qui sera appelé dual ou dual hermi- 
tien de l'espace À et noté L”°. 

La base Ip', ..…, pl de l’espace .f* est dite biorthogonale à la base 
le,, .…, e, 1 de l’espace Æ si 

| 0, i+j, 
PRE h i= j. 


Si x est la matrice-ligne des coefficients de la fonction semi-linéaire f dans 
la base e, la colonne de coordonnées de f dans la base biorthogonale sera 
2%. 

Considérons deux espaces vectoriels complexes .# et .z7, et une applica- 
tion À :.,# — #. On dit que l’application A° : 277 — .#° est adjointe de 
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l’application À si pour tous x e Z et fe Pa on a 
CA°(N),x) = ( f, A(x)). (19) 


Ainsi donc, cette définition de l’application adjointe ne diffère pas, par 
la forme, de la définition correspondante donnée pour les espaces réels. 
Aussi toutes les propriétés exposées au début de ce paragraphe se 
conservent-elles avec d’infimes modifications. Notamment, la proposition 
2 devient : 


PROPOSITION 16. Si À est une matrice de l'application À : 4 — 2 par 
rapport à un couple de bases, A* = ‘A est celle de | application adjointe 
par rapport aux bases biorthogonales correspondantes. 


En effet, choisissons dans D et ”° deux bases et désignons par g et x 
les matrices-lignes de coordonnées des fonctions semi-linéaires f et A° (f) 
par rapport à ces bases. L'égalité (19) est alors équivalente à l’égalité matri- 
cielle n£ = xAË = x AE qui est vérifiée pour toute matrice-colonne E£. Il 
s’ensuit alors que 


A = XA, (20) 


d’où la proposition. 

La proposition 6 se voit également modifiée lorsqu’on l’applique aux 
transformations linéaires d'espaces complexes. 

Dans la proposition 3, toutes les assertions demeurent vraies à l’excep- 
tion de la formule (8) qui prend la forme 


(«A)° = &A*. (21) 


La démonstration de la proposition 7 utilise la coïncidence des polynô- 
mes caractéristiques des matrices À et 4. Comme 


det (‘4 — XE) = det (4 — XE), 
la proposition 7 devient : 


PROPOSITION 17. Si À est une valeur propre de la transformation À de 
l'espace vectoriel complexe , À est une valeur propre de la transforma- 
tion adjointe À° : {°° — : ,et X est de la même multiplicité que X. 


Dans la proposition 9 appliquée à un espace complexe, il faut exiger que 
les valeurs propres ne soient pas conjuguées, c’est-à-dire que À # y, au lieu 
de À # A pour les espaces réels. 

Les autres résultats des points 2 à 5 sont reportés aux espaces complexes 
sans être modifiés si l’on entend par un espace dual l’espace dual hermitien. 

Considérons un espace unitaire ‘7,. Etant donné un vecteur a € #,, 
associons à chaque vecteur x e %, le nombre (a, x). Il est aisé de vérifier 
qu’on définit ainsi une fonction semi-linéaire sur ‘7, . Inversement, à cha- 
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que fonction semi-linéaire f sur %, on peut associer un vecteur a tel que 
(S,x) = (a, x) 


pour tout xe %,. La relation qui à chaque fonction semi-linéaire f sur ‘#, 
fait associer son vecteur a est un isomorphisme F : ‘4° — 7 permettant 
d'identifier ces espaces. Cette identification est courante. 

Soit donnée une application linéaire d’espaces unitaires À : %#, — ‘7. 
Vu que chaque espace est identifié avec son dual, l’application adjointe A° 
de A applique 7, dans #,. Elle satisfait à la condition 


(A° Oo), x) = (x, A(x)) 


pourtousxe #,etye #,.Les matrices des applications À et A° sont liées 
par la relation 


(4°) = F4, 


où let Fsont les matrices de Gram des bases choisies dans ‘7, et %,. 
Ainsi, la formule (11) prend pour les espaces unitaires la forme 


A° = M-!')'AT. 


Avec les définitions introduites, tout le contenu des points 6 et 7, 
accompagné d’infimes modifications, est reporté au cas des applications 
d’espaces unitaires. Par exemple, dans l’énoncé du corollaire de la proposi- 
tion 11, on parlera non pas d’une forme quadratique mais d’une forme 
quadratique hermitienne. 


$ 2. Transformations linéaires ‘dans un espace euclidien 


Dans ce paragraphe, on reporte les résultats du $ 1 aux transformations 
dans un espace euclidien. Toutefois, il s’avère commode de s’arrêter au 
préalable sur quelques propriétés importantes des transformations auto- 
adjointes, non rattachées au contenu déjà exposé. 

1. Transformations commutables. Les transformations À et B sont 
dites commutables si AB = BA. Les propriétés suivantes de ces transfor- 
mations sont valables aussi bien dans les espaces réels que complexes. Plus 
loin, la notation Im B désigne partout l’ensemble des valeurs de la trans- 
formation B, noté auparavant B(_”). 


PROPOSITION 1. Si les transformations linéaires À et B de l’espace vecto- 
riel -, sont commutables, les sous-espaces Ker B et Im B sont invariants 
par À. 

En effet, supposons que x e Im B, c’est-à-dire qu’il existe un y e Z tel 
que x = B(y). Alors A(x) = AB(y) = BA(r) € Im B, de sorte que Im B 
est invariant. 
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Soit ensuite x e Ker B, c’est-à-dire B(x) = o. Alors, B(A(x)) = 
= AB(x) = o. Cela signifie que A(x) e Ker B, et donc Ker Best invariant. 

Appelons sous-espace propre de la transformation À un sous-espace 
formé de tous les vecteurs propres associés à une même valeur propre de À, 
et du vecteur nul. 


PROPOSITION 2. Si AB = BA, les sous-espaces propres de B sont inva- 
riants par À. 

Le sous-espace propre associé à la valeur propre X est Ker (B — ÀE). Si 
AB = BA, on a A(B — XE) = (B — XE)A, ce qui démontre l’assertion en 
vertu de la proposition 1. 


Les transformations À et À — ÀE étant commutables, on a le 


CoROLLAIRE. Le sous-espace Im (À — XE) est invariant par la transfor- 
mation À. 


Remarquons que l’invariance de Ker (À — ÀEË) est évidente : c’est un 
sous-espace propre Ou un sous-espace nul. 

2. Propriétés d’extrémum des valeurs propres. Considérons une trans- 
formation symétrique À de l’espace euclidien <. La fonction 


AG), x) 

(x, x) 
définie sur tout l’espace < à l’exception du vecteur nul, est appelée qguo- 
tient de Rayleigh de la transformation À ou de la forme quadratique 


(A(x), x). On appellera sphère unité ./ dans < l’ensemble des vecteurs de 
longueur 1. 


p(x) = 


PROPOSITION 3. L'ensemble des valeurs du quotient de Rayleigh se con- 
fond avec l’ensemble des valeurs de la forme quadratique (A(x), x) sur la 
sphère unité. | 

En effet, quel que soit le vecteur x de . la valeur de la forme quadrati- 
que sur x est égale à la valeur du quotient de Rayleigh sur le même vecteur. 
Inversement, si pour un x e < non nul on a p(x) = «, alors a = (A(y), y), 
où y = Ixl-lxe.f. 

On aura besoin de connaître les valeurs maximales et minimales du quo- 
tient de Rayleigh. En vertu de la proposition 3, on peut à leur place, consi- 
dérer les valeurs maximales et minimales de (A(x), x) sur .#. 

Soit Île,, .…, e,l une base orthonormée des vecteurs propres de la trans- 
formation À. On supposera que les vecteurs de base sont ordonnés de 
manière que les valeurs propres correspondantes forment une suite décrois- 
sante: À 2 >... 2> 

Ecrivons la valeur de la forme quadratique sur le vecteur x e . dans la 
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base e = le,, …,e,l : 


(AGX),x) = YA (EP. (1) 


1-1 


Z (£')* est ici égale à 1 car x e .“. Si l’on remplace toutes les valeurs pro- 
pres par leur valeur maximale, on perturbera en général l’égalité (1) en aug- 
mentant son second membre. Donc, 


p(x) = (A(x), x) < À, (CE) = À. (2) 


im) 
La borne supérieure mentionnée est atteinte sur le premier vecteur de base : 
p(e,) = x. 


De façon analogue on démontre que p(x) 2 À, et p(e,) = X,. On a ainsi 
obtenu la 


PROPOSITION 4. La valeur maximale du quotient de Rayleigh est égale à 
la plus grande valeur propre de la transformation À, tandis que la valeur 
minimale, à la plus petite valeur propre. Ces valeurs se présentent sur les 
vecteurs propres correspondants. 


CoRoOLLAIRE. Si la forme quadratique \ est définie positive, le rapport 
des valeurs de deux formes quadratiques Kk(x)/WKx) est encadré, pour tout 
vecteur x, par la plus grande et la plus petite racine de l'équation det (A — 
— ÀB) = 0, où A et B sont les matrices associées aux formes quadratiques 
k er | dans une base e. 


En effet, soient £ et # les colonnes de coordonnées du vecteur x respecti- 
vement dans la base e et dans la base canonique de la forme quadratique |. 
Alors, si £ = Sæ#, on a 'SBS = E et B = ('S)-!'S-!. Pour le rapport 
k(x)/I(x), on trouve 


AE _ 'a'SASe 
IE BE TE 


Introduisons le produit scalaire à l’aide de la forme quadratique Î (voir 
théorème 2, $ 3, ch. VIII). La base canonique devient alors orthonormée 
relativement à ce produit scalaire, quant au rapport considéré, il s’avère 
égal au quotient de Rayleigh de la transformation dont la matrice dans 
cette base est “SAS. Il s’ensuit que k(x}/I(x) se trouve encadré par la plus 
grande et la plus petite racine de l’équation det (“SAS — XÀE) = 0. Or 


det (SAS — XE) = det 'S det (4 — A(S)-!'S-!) det S 
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et les racines de l’équation coïncident avec celles de l’équation 
det (4 — ÀB) = 0. La démonstration est ainsi achevée. 

Considérons maintenant un sous-espace <, dans “ et la restriction de 
la forme quadratique k(x) = (A(x), x) à 5, . La restriction de la forme 
quadratique est une fonction k” sur , “telle que k’(x) = k(x) pour tout x 
de , ‘. Il est évident que Kk’ est une forme quadratique sur 4, ‘ et qu’elle 
possède une base orthonormée dans <, ” par rapport à laquelle elle se 
décompose en carrés : 


k 
KG = LG». 


ini . 


Admettons que les vecteurs de base sont numérotés de manière que u,, … 
……, 4, forment une suite décroissante : u, > pu, > .… > u,. Dans ce cas, y, 
est le maximum du quotient de Rayleigh pour k’(x) et, partant, la valeur 
maximale qu’il prend pour k(x) sur le sous-espace é, ”. 


PROPOSITION 5." Soient X,, .…, À, les valeurs propres de la transformation 
symétrique À, et u,, .…, u, les valeurs propres de sa restriction au sous- 
espace invariant k-dimensionnel, numérotées dans l'ordre décroissant. 
Alors 


NETTETÉ (3) 


En effet, la sphère unité .” de l’espace “, ‘est contenue dans la sphère 
unité de l’espace “,, et la valeur maximale de la fonction sur un sous- 
ensemble est au plus égale à sa valeur maximale sur tout l’ensemble, de 
sorte que À, > Hu. 

Démontrons la seconde inégalité. A cet effet, choisissons dans <, ” un 
vecteur x dont les coordonnées dans la base canonique de la forme quadra- 
tique k(x) sont (£!, ..., £7-K+1, 0, ..., 0), c’est-à-dire un vecteur situé dans 
l'intersection de “, avec l’enveloppe linéaire des #7 — k + 1 premiers vec- 
teurs de base. L’intersection de ces espaces contient un vecteur non nul car 
la somme de leurs dimensions est strictement supérieure à 7. Soit 
} = lxl-!x. En substituant À,_,,, à toutes les valeurs propres, on obtient 


k'O) = kO) = À Gt} +. + XP D Xeon 


d’où l'inégalité nécessaire. 

Pour un sous-espace donné “,”, la quantité u, est une constante, mais 
qui varie avec le passage à un autre sous-espace “,°” tout en vérifiant la 
double inégalité (3). Ceci étant, elle peut atteindre soit À,, soit À,_,,,. En 
effet, désignons par “, l'enveloppe linéaire des vecteurs e,, ..…, e,. Dans ce 
sous-espace, le quotient de Rayleigh atteint sur le vecteur e, son maximum 
absolu, soit : À, = p(e,), de sorte que u, = À,. Pour l’enveloppe linéaire 
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des vecteurs e,_,,,, …, e,, on a px) = À,_,,,(n7-<+1}? + 
n 
+ À, (77)?, où D) (7) = 1. Donc po(x) < À,_,,, et 
‘=n-k+1 

= P(e,_x41) n À ki . 

On arrive ainsi au théorème suivant. 

THÉORÈME ]. Etant donné que les valeurs propres d’une transformation 
linéaire symétrique forment une suite décroissante X\, > À, > … > À,,on 
a 


À 


n=k+1 = Min max p(x), 


e Ck O#XE CL 


ou le maximum est pris suivant tous les vecteurs non nuls du sous-espace 
,, et le minimum suivant tous les sous-espaces invariants de dimension k. 


On a vu en effet que À,_,,, est la borne inférieure atteinte pour y, et 


que y, est égal à max p(x) selon la proposition 4. 
OfXxE 4 


Notons “,_, l'enveloppe linéaire des n — & premiers vecteurs de base 
e,, .…, €,_,. Son supplémentaire orthogonal “,_, contient le vecteur 
e,_-1+1 Pour lequel p(e,_,,,) = À,_4,,- Cela signifie que le minimum 
dont il s’agit dans le théorème 1 est atteint pour le sous-espace (<7_,)*. 
Ces considérations permettent de se représenter comment se construit la 
base orthonormée formée des vecteurs propres de la transformation À, 
processus qu’on décrira sans entrer dans les détails de sa réalisation. 

On recherche d’abord le vecteur sur lequel est atteint le maximum du 
quotient de Rayleigh, plus précisément l’un de ces vecteurs. Ensuite, dans 
le supplémentaire orthogonal du sous-espace engendré par ce vecteur, on 
cherche de nouveau le vecteur sur lequel est atteint le maximum. Après 
quoi, on recherche le maximum dans le supplémentaire orthogonal de 
l’enveloppe linéaire engendrée par deux vecteurs choisis, etc. Il ne reste 
finalement qu’à normer le système des vecteurs obtenus. 

Pour justifier cette construction, il faut démontrer que le maximum du 
quotient de Rayleigh n’est atteint que sur le vecteur propre. On le réalise en 
recourant à la méthode de Lagrange permettant de trouver l’extremum lié 
(voir Koudriavtsev [21], t. II, $ 42). La fonction de Lagrange est de la 
forme : 


Z ab À Q (Y. 


4,71 im! 


En égalant à zéro ses dérivées partielles, on obtient le système d’équations 
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que vérifient les vecteurs propres : 
GE 204 Et = NE 


I 
_ 


3. Décomposition polaire. On sait que la transformation affine du plan 
se décompose en produit d’une transformation orthogonale et de deux con- 
tractions vers des droites perpendiculaires. 

On va maintenant généraliser ce résultat pour une transformation 
linéaire À de l’espace euclidien. La décomposition dont il s’agit s’appelle 
décomposition polaire de A. 


THÉORÈME 2. Pour toute transformation linéaire À de l’espace euclidien 
«, il existe une transformation symétrique S à valeurs propres positives et 
une transformation orthogonale P telles que 


A = PS. (4) 


Avant de démontrer le théorème, il convient de considérer la proposi- 
tion suivante. 


PROPOSITION 6. Si le,, ., e,l et 1f,, …, f,l sont des bases orthonor- 
mées dans ‘,,, il existe une transformation orthogonale P telle que P(e.) = 
= f.(i=1,...,n). 

En effet, la condition P(e.) = J: définit de façon univoque toutes les 
colonnes de la matrice associée à la transformation P dans la base e, ce sont 
les colonnes de coordonnées des vecteurs f,, ., f,. Notons-les g.. Vu que 
le système de vecteurs f est orthonormeé, il vient 


0, i+J, 
{ = 
HE Fi i= j, 


de sorte que la matrice de la transformation est orthogonale, d’où la con- 
clusion recherchée. 

Passons maintenant à la démonstration du théorème 2. Soient e = 
= lle,,...,e, let f = 1f,,.….,/, 1 les bases singulières de la transformation 
À. (Comme À est une transformation, les deux bases sont des bases dans 
4, -) On a alors pour tous les i = 1,...,n 


A(e;) = af; 


où a, sont les nombres singuliers de la transformation A. En effet, pour i < 
< Rg A, c’est la définition des vecteurs /., et pour les autres i on a d’une 
part a, = 0 et d’autre part A(e,) = o, si bien que l’égalité est vérifiée. 
Considérons maintenant une transformation orthogonale P du à Ta 
première base singulière fait correspondre la seconde : P(e,) =ÿ{£ {2 
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= 1,..., n. Démontrons que la transformation S = P-!A est symétrique. 
En effet, pour tout ; on a 


P-1A(e.) = P-!(a.f) = ae. (S) 


Ainsi donc, la transformation S possède une base orthonormée des vec- 
teurs propres e,, .…,e,. Sa matrice y est diagonale et par suite, symétrique. 
Donc, S est une transformation symétrique. On voit en outre de (5) que les 
valeurs propres de S sont égaux à æ,, …, æ, et par suite, sont positives. On 
achève ainsi la démonstration du théorème. 

Le théorème 2 peut être formulé en termes de matrices. 


THÉORÈME 2M. Pour toute matrice carrée À il existe une matrice orthogo- 
nale P et une matrice symétrique S$, avec nombres caractéristiques positifs, 
telles que 


A = PS. (6) 


PROPOSITION 7. Pour toute transformation linéaire À de l'espace eucli- 
dien €, il existe une transformation orthogonale P ” et une transformation 
symétrique S° à valeurs propres positives, telles que À = S'P:. 


Pour le démontrer, écrivons la décomposition (4) pour la transforma- 
tion A*. Soit A* = P,S,. On a alors À = S'P} = S,P;!et l’on peut 
poser S’ = S,et P° = P;:!. 

4. Unicité de la décomposition polaire. Si la transformation À est repré- 
sentée sous forme de PS, où S est une transformation symétrique et P une 
transformation orthogonale, on a A° A = S° P* PS = S2. Montrons que 
la transformation S se définit d’après S? et partant d’après A de façon uni- 
que. Démontrons d’abord pour cela la proposition suivante. 


PROPOSITION 8. Les vecteurs propres de la transformation S sont des vec- 
teurs propres de la transformation S?. Si S est une transformation symétri- 
que à valeurs propres positives, les vecteurs propres de la transformation 
S2 sont aussi propres pour S. Dans ce cas, les valeurs propres de la trans- 
formation S sont égales aux racines carrées arithmétiques des valeurs pro- 
pres correspondantes de S!. 


DÉMONSTRATION. 1) Soit S(x) = ax pour un vecteur x # o. Alors 
S2(x) = S(S(x)) = S(ax) = x. 

2) Soit S'(x) = Àx et soient £' les coordonnées du vecteur x par rapport 
à la base orthonormée e = Île,, …, e,Î composée des vecteurs propres de la 
transformation S. On a alors 


S(x) = À D) £ie, = D A£'e.. 


Î 
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D'autre part, si a; sont les valeurs propres de S, on a 


S2(x) ” y £iS?(e.) — y tiæe.. 


Il en découle que £'(aœ? — À) = 0 pour tous les i = 1, …, n. Ainsi, £' = 0 
pour tout i tel que & # À. Vu que a; est positif, les égalités a? = À et œ - 
= À ne peuvent se vérifier qu’à la condition a, = &,. Le vecteur x se décom- 
pose donc suivant les vecteurs de la base e, qui correspondent à une même 
valeur propre. Cela signifie qu’il est également un vecteur propre pour la 
transformation S et qu’il est associé à la valeur propre a, = VX. La propo- 
sition est démontrée. 

L’unicité de la transformation S résulte maintenant de la proposition 
suivante. 


PROPOSITION 9. La transformation symétrique S se définit de façon uni- 
vogue par ses valeurs propres et ses vecteurs propres. 


Pour le démontrer, considérons une famille de sous-espaces 4, .…, # 
dont chacun est engendré par les vecteurs propres associés à une même 
valeur propre et par le vecteur nul. Il y a autant de sous-espaces que de 
valeurs propres différentes. Chaque vecteur se décompose de façon unique 
en une somme de la forme 


X=X +... +Xx,, Où X,EZ,. 


En effet, on peut obtenir une telle décomposition en groupant les termes 
dans la décomposition de x suivant toute base de vecteurs propres. Démon- 
trons l’unicité de la décomposition. Si on en avait deux : x = x, + … 
A 0 DE + y, On aurait CR 20 EE à (x, = ),) = 0. La 
différence x, — y, de “ appartient également dans ce cas à la somme de 
tous les autres sous-espaces. Si elle n’est pas nulle, il en découle aussitôt la 
dépendance linéaire des vecteurs propres associés aux valeurs propres diffé- 
rentes. 

Si donc la décomposition de x est définie de façon univoque, il en est de 
même de son image S(x) : 


S(x) = ax, + … + a,X, - 


La proposition est démontrée. 
On pourrait sans peine exprimer S(x) dans la base orthonormée des 
vecteurs propres : 


S(x) = Ÿ (x, 6)e,, (D) 


im! 
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mais dans ce cas il aurait fallu montrer que le résultat est indépendant du 
choix de la base. 

Dans le cas général, la transformation orthogonale P qui figure dans la 
décomposition polaire de la transformation À n’est pas parfaitement défi- 
nie. Toutefois, si la transformation À n’est pas dégénérée, autrement dit, si 
Rg À = n,ilen est de même de la transformation S et, par suite, P est par- 
faitement défini comme AS7!. 

S. Nombres singuliers et bases singulières d’une transformation. On a 
introduit dans le $ 1 les nombres singuliers et les bases singulières d’une 
application d’un espace euclidien dans l’autre. Maintenant on les étudiera 
en détail pour le cas d’une transformation. 

Il découle de la formule (5) obtenue lors de la démonstration du théo- 
rème 2 que les nombres singuliers d’une transformation À sont égaux aux 
valeurs propres de la transformation symétrique S qui figure dans la 
décomposition polaire de À, et que la première base singulière de À est 
constituée des vecteurs propres de S. 

Voyons quelle est l’interprétation géométrique des nombres singuliers 
dans l’espace éuclidien tridimensionnel. L’image par la transformation A 
de la sphère unité. /, est un ellipsoïde. Considérons un rayon quelconque 
de cet ellipsoïde, c’est-à-dire la longueur d’un vecteur A(x) tel que (x, x) = 
= ].1l vient, 


IA(x)l? = (A(x), A(x)) = (A° A(x), x). (8) 


Pour le vecteur x situé sur la sphère unité, cette expression coïncide avec le 
quotient de Rayleigh pour la transformation À * A dont les valeurs propres 
sont les carrés des nombres singuliers. Il ressort donc de la proposition 4 
que 


pour tous les x e .,. Cela signifie que «, et &, sont le plus grand et le plus 
petit rapport des longueurs de l’image et de son antécédent par la transfor- 
mation À. Il est évident que «, et æ, sont les demi-grand et -petit axes de 
l’ellipsoïde. 

Ensuite, selon le théorème 1, 


œ, = min max |lA(x)|. 
L la oRxXE 


Le minimum est atteint sur le plan orthogonal au grand axe de l’ellipsoïde, 
avec max | A(x)l égal au demi-grand axe de l’ellipse située dans ce plan. 
Par suite, æ, est le troisième demi-axe de l’ellipsoïde. 

Ainsi, les nombres singuliers caractérisent une traction de l’espace en- 
gendrée par la transformation À, indépendamment de la rotation des vec- 
teurs au cours de la transformation. Pour une transformation symétri- 
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que ils sont égaux aux modules des valeurs propres, mais ils sont aussi 
définis dans le cas d’une transformation quelconque. Leur signification 
géométrique peut être facilement généralisée à un espace de dimension 
quelconque, car la formule (8) ne dépend pas de la dimension de l’espace. 
Notons en particulier la proposition suivante. 


PROPOSITION 10. Pour toute transformation linéaire À de l'espace 
euclidien <,, 


lA(x)| >: es |A(x)| : 


o#xec, |x1 o#xE“, [x du 


où a, et a, sont le plus grand et le plus petit nombre singulier de la transfor- 
mation À. 

En effet, en posant y = |xl”!x, on déduit de la formule (8) que le carré 
du rapport lA(x)l/lxl est égal au quotient de Rayleigh pour la transfor- 
mation À * À. D’où en vertu de la proposition 4, on obtient la conclusion 
recherchée. 

Donnons quelques propriétés des nombres singuliers. Le déterminant et 
la trace de la matrice d’une transformation linéaire ainsi que tous les coeffi- 
cients de son polynôme caractéristique, sont les invariants de la transfor- 
mation. Les propositions suivantes indiquent le lien qui les relie aux nom- 
bres singuliers. 


PROPOSITION 11. Le déterminant de la matrice de la transformation 
linéaire dans un espace euclidien est égal en valeur absolue au produit des 
nombres singuliers. 


Pour le démontrer, calculons le module du déterminant de chacun des 
deux membres de l’egalité (6). On obtient 


Idet Al = |det PI - Idet S|. 


ldet PI est ici égal à 1 car la transformation P est orthogonale, et det S 
vaut le produit des valeurs propres de la transformation S, égales aux nom- 
bres singuliers. D’où ldet Al = &,...a,, ce qu’il fallait démontrer. 


PROPOSITION 12. La valeur absolue de la trace de la matrice d'une trans- 
formation linéaire À ne dépasse pas la somme de ses nombres singuliers. 


Pour le démontrer, écrivons la décomposition polaire de À dans la pre- 
mière base singulière et représentons sa matrice sous la forme À = PS, où 
S est la matrice diagonale avec nombres singuliers sur la diagonale. Il est 
aisé de vérifier que lorsqu'on multiplie P par la matrice diagonale, chaque 
colonne de P devient multipliée par un élément correspondant de la diago- 
nale de S. Aussi la trace de À est-elle égale à la somme des produits des 
éléments diagonaux correspondants de P et S. Or les éléments de la matrice 
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orthogonale sont inférieurs en valeur absolue à l’unité. D’où 
ltr AI < » PACA < y ;) 
ce qu’il fallait démontrer. 


PROPOSITION 13. Les nombres singuliers de la transformation À ne chan- 
gent pas quand on la multiplie à gauche ou à droite par la transformation 
orthogonale U. 


DÉMONSTRATION. Soit À la matrice de la transformation À dans une base 
orthonormée. Ecrivons sa décomposition singulière (18) du $ 1 : À = 
= QDP, où Q et P sont des matrices orthogonales, et D une matrice diago- 
nale carrée d'ordre n. Les nombres singuliers de la transformation À sont 
les éléments diagonaux de la matrice D. La matrice de la transformation 
AU est AU = QDPU, où PU est une matrice orthogonale. En appliquant le 
théorème 2 du $ 1 on constate que les éléments diagonaux de la matrice D 
sont les nombres singuliers de la transformation AU. 

Pour le produit UA, la proposition se démontre de façon analogue. 


PROPOSITION 14. Les nombres singuliers de la transformation À 
coïincident avec les nombres singuliers de la transformation adjointe AÀ*. 


Cette proposition découle directement de la proposition 14 du $ 1. 


PROPOSITION 15. L'image de tout vecteur par une transformation peut 
être obtenue si sont connus les nombres singuliers et les bases singulières de 
cette transformation. 

En effet, écrivons le développement d’un vecteur quelconque dans la 
première base singulière : 


X = y (x, e,)e, 


et considérons les images des deux membres de l’égalité par la transforma- 
tion symétrique S intervenant dans la décomposition polaire À = PS : 


SG) = Y (e)S(e) = Z ait, e)e. 
i 


î 


Recherchons ensuite les images des deux membres de cette égalité par la 
transformation orthogonale P. On obtient la décomposition 


A(x) = D) a;(x, e,)P(e,) = D a;(x, e,)/;, 


où f; sont les vecteurs de la seconde base singulière, et a; les nombres 
singuliers. 
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A titre d'exercice, le lecteur peut essayer d’obtenir la proposition 15 à 
partir du théorème 2, $ 1, et les propositions 13 et 14 s’il utilise la décom- 
position polaire. 

6. Etude des résultats pour les espaces unitaires. Considérons une trans- 
formation auto-adjointe À de l’espace unitaire Z . Le quotient de Ray- 
leigh se définit pour À de la même façon que dans le cas d’un espace eucli- 
dien. Etant donné la base orthonormée des vecteurs propres de la transfor- 
mation À, on peut écrire 


p(x) = (AG), x) = LEE , 
(x, x) ÿ EE! 


où À, sont les valeurs propres de la transformation A. Il s’ensuit une asser- 
tion équivalente à la proposition 4 : pour tout x, on a 


N, SP) < À, (9) 


(à condition que les valeurs propres forment une suite décroissante). 

Les propriétés de l’extrémum des valeurs propres, qui ont été formulées 
au théorème 1, sont reportées sans changements aux transformations auto- 
adjointes dans les espaces unitaires. 

La décomposition polaire de la transformation linéaire dans un espace 
unitaire est de la forme 


A =PS, 


où P est une transformation unitaire et S une transformation auto-adjointe 
à valeurs propres positives. La démonstration de l’existence et de l’unicité 
de cette décomposition pour des transformations inversibles ne diffère pra- 
tiquement pas de la démonstration donnée pour les espaces euclidiens : on 
prend pour P la transformation unitaire qui à la première base singulière 
fait correspondre la seconde, tandis que S = P-!A est la transformation 
auto-adjointe dont les valeurs propres sont égales aux nombres singuliers 
de A. 

Les propriétés des nombres singuliers, obtenues au point 5, sont repor- 
tées presque sans changement aux espaces unitaires. On a ainsi la 


PROPOSITION 16. Les nombres singuliers de la transformation À ne chan- 
gent pas quand on la multiplie à droite ou à gauche par une transformation 
unitaire Q. 

7. Réduction de la matrice d’une transformation linéaire à la forme 
triangulaire. 

PROPOSITION 17. Chaque transformation linéaire À d’un espace vectoriel 
complexe /,, présente un vecteur propre. Tout sous-espace invariant par la 
transformation À contient un vecteur propre. 


20—6442 
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La première assertion est évidente, vu que l’équation caractéristique a au 
moins une racine qui est une valeur propre. La deuxième assertion découle 
de la première si celle-ci est appliquée à la restriction de la transformation 
considérée sur un sous-espace invariant. 

Les propositions 4 et 17 entraïnent la 


PROPOSITION 18. Tout couple de transformations commutables dans un 
espace complexe possède un vecteur propre commun. 


En effet, soient À et B deux transformations qui commutent. Tout 
espace propre de la transformation B est invariant par À et par suite, con- 
tient un vecteur propre de À. 

La proposition 17 signifie précisément que tout sous-espace invariant 
contient un sOous-espace invariant unidimensionnel. On peut de même 
démontrer la proposition suivante. 


PROPOSITION 19. Tout espace k-dimensionnel invariant par la transfor- 
mation linéaire À dans l'espace complexe X, , contient un sous-espace in va- 
riant (k — 1)-dimensionnel. 


Démontrons d’abord que pour la transformation À dans l’espace vecto- 
riel complexe _, il existe un sous-espace (7 — 1)-dimensionnel #_, quiest 
invariant par À. Pour le faire, considérons le sous-espace Im (À — XE), où 
X est une valeur propre de À. Ce sous-espace est, comme on l’a vu, inva- 
riant par À et est de dimension Rg (A — ÀEË) strictement inférieure à n. Elle 
peut même s’avérer strictement inférieure à ñ — 1. Dans ce cas, démon- 
trons que tout sous-espace # _, comprenant Im (A — ÀË) est invariant par 
A. | 

En effet, posons Im (A — XE) © #_,. Alors (A — AE)jxe Z_, pour 
tout vecteur x. Maintenant si x e ,_,, il découle alors de A(x) — Àx € 
(= Zn - | que A(x) €e /,_,, ce qui signifie justement que le sous-espace #,_, 
est invariant. 

Pour démontrer la proposition pour un £ quelconque, il suffit mainte- 
nant d’appliquer l’assertion démontrée à la restriction de la transformation 
À sur un sous-espace invariant k-dimensionnel. 

Il découle de la proposition 19 déjà démontrée que pour toute transfor- 
mation linéaire d’un espace vectoriel complexe Z il existe une suite de 
sous-espaces invariants injectés l’un dans l’autre Z_,,#_,, .…, 4 de 
dimensions n — 1,n — 2,..., 1: 


FE PCA C7 C2 (10) 
En effet, pour construire ces sous-espaces, on peut reprendre plusieurs 


fois la proposition (19) : à chaque étape, on l’applique à un sous-espace 
invariant construit à l’étape précédente. 


DÉFINITION. On dit que la matrice À d’éléments af est triangulaire supé- 
rieure (resp. inférieure) si a = 0 pour i > j (resp. pour i < j). 

PROPOSITION 20. Pour toute transformation linéaire À de l’espace vecto- 
riel complexe _Z il existe une base dans laquelle sa matrice est triangulaire 
supérieure. 

Pour le démontrer, construisons une base en nous appuyant sur les 
sous-espaces invariants (10) de la façon suivante : e, e , le vecteur e, 
forme avec e, une base dans #, le vecteur e, complète e,, e, jusqu’à une 
base de _,, etc. Ainsi, pour tous les & = 1, .…, n, les vecteurs e,, ..., e, 
constituent une base dans #. Vu que les sous-espaces _/, sont invariants, 
le vecteur A(e,) appartient au sous-espace pour tout K et, partant, se 
développe suivant les vecteurs e,, …., e,. Il s’ensuit que pour les éléments 
ai, de la matrice de À on a af, = 0 pour i > k, ce qu’il fallait montrer. 

Pour les espaces unitaires la proposition 20 devient : 


THÉORÈME 3. Pour toute transformation linéaire d’un espace unitaire ‘Z, 
il existe une base orthonormée dans laquelle sa matrice est triangulaire 
supérieure. 

Pour le démontrer, il suffit de noter que la base construite dans la pro- 
position 20 est dans une large mesure arbitraire et elle peut être choisie 
orthonormée. En effet, en utilisant le procédé d’orthogonalisation de 
Gram-Schmidt, on ajoute à tout vecteur e, un vecteur qui appartient à 
l’enveloppe linéaire engendrée par e,, ..…., e,_,, c'est-à-dire à ,_,, de 
sorte que le vecteur qui en résulte appartient encore à _-, . 


$ 3. Espaces normés 


1. Définition. Dans nombre de problèmes liés aux espaces vectoriels, il 
s’avère nécessaire de comparer deux éléments d’un espace, par exemple de 
pouvoir affirmer qu’un vecteur est dans un certain sens plus petit qu’un 
autre. Dans un espace euclidien, il est naturel de comparer les vecteurs en 
longueur. Dans les autres espaces, on peut aussi introduire un produit sca- 
laire, mais souvent la nature de leurs éléments est telle qu’il n’existe aucun 
produit scalaire qui lui soit naturellement lié. Par ailleurs, il se peut que le 
produit scalaire ne soit pas nécessaire et on n’a besoin que d’un certain ana- 
logue de la longueur du vecteur, à savoir d’une fonction numérique de vec- 
teur présentant quelques propriétés importantes. Ces fonctions sont intro- 
duites au moyen de la définition suivante. 


DÉFINITION. Soit une fonction $ qui à chaque vecteur d’un espace vecto- 
riel réel ou complexe “associe un nombre réel. Cette fonction est appelée 
norme et sa valeur sur le vecteur x, norme de ce vecteur, si sont satisfaites 


20° 
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les conditions suivantes pour tous vecteurs x et y et tout nombre À : 

1) (x) > 0 pour tout x + 0; 

2) p(Xx) = IXle(x) (« homogénéité positive ») ; 

3) o(x + y) < ex) + e(y) (« convexité »). 

L’espace vectoriel sur lequel est définie une norme est dit normé. On 
note souvent xl la norme du vecteur x. A la place de l’expression « norme 
dont la valeur sur le vecteur x est noté Îxl », on dira et écrira « norme 
D xl ». 

Remarquons que la propriété 2) entraîne #ÿ(o) = 0. 

Une autre propriété des normes s’écrit par l’inégalité 


ex — y) 2 lex) — #(y)l. (1) 
En effet, 
px) — 60) = ex — y + y) — eL) < 
< (x — y) + e(y) — (y) = px — y). 
De façon analogue on démontre que 
PO) — (x) < EU — x) = px — y). 


Dans un espace normé, on est en mesure de définir la distance entre les 
vecteurs x et y comme la norme de leur différence y — xl. La distance 
ainsi définie possède les propriétés caractéristiques de la distance entre les 
points de l’espace euclidien : elle est positive et s’annule si et seulement 
si x coïncide avec y. En outre, Hp — xl = Ix — yl, c’est-à-dire que la dis- 
tance est symétrique, et l’inégalité triangulaire est vérifiée : [x — y + 
+ y — zl > x — zl. 

L'ensemble des vecteurs d’un espace normé, dont la distance à un vec- 
teur a ne dépasse pas un nombre donné € est appelé e-voisinage du vec- 
teur a. 

En utilisant la notion de voisinage, on est en mesure de définir la limite 
d’une suite de vecteurs dans l’espace normé : le vecteur a est appelé limite 
de la suite de vecteurs {x, ] si pour chaque € > Oil existe un nombre k, (e) tel 
que tous les éléments de la suite à partir de l’élément de numéro k, se trou- 
vent dans le e-voisinage du vecteur a, ou plus brièvement, chaque voisinage 
du vecteur a contient tous les éléments de la suite à l’exception d’un ensem- 
ble fini. 

Ainsi, il apparaît la possibilité de reporter sur les espace normés, sous 
une forme ou l’autre, toutes les notions d’analyse mathématique élémen- 
taire. Notre objectif n’est pas d’exposer cette théorie. On peut s’initier à ses 
éléments en s’adressant aux cours d’analyse mathématique. 

Les espaces normés jouent en analyse mathématique un rôle très impor- 
tant. Cela s’explique par le fait que les problèmes d’analyse mathématique 
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se rapportent le plus souvent non pas à des fonctions isolées, mais à des 
classes de fonctions. Ces classes ont des structures d’espaces vectoriels de 
dimension infinie, normés ou même plus généraux, dits espaces topologi- 
ques vectoriels. Le domaine des mathématiques étudiant ces espaces est 
appelé analyse fonctionnelle. 

En algèbre linéaire, on étudie les espaces vectoriels de dimension finie, 
de sorte que les notions d’analyse se rattachant au passage à la limite ne 
joueront pas pour nous un rôle prépondérant. On discutera dans ce para- 
graphe des normes les plus courantes sur les espaces vectoriels de dimen- 
sion finie et en particulier, des normes sur les espaces des matrices. On 
montrera toutefois plus loin que sous l’angle de convergeance des suites en 
norme la différence entre les normes sur un espace de dimension finie est de 
peu d’importance. 

2. Exemples de normes. Considérons un espace arithmétique de dimen- 
sion n, réel ou complexe, c’est-à-dire l’espace vectoriel des matrices- 
colonnes réelles ou complexes à 7 éléments. Dans cet espace, les normes les 
plus courantes pour une matrice-colonne à éléments £', i = 1, ...,n, sont : 


1) NEU, y [£'l, norme octaédrique ou l-norme ; 


1/2 
(5 F4 F) , norme euclidienne, ou norme unitaire sur 


2) IE, 
l’espace complexe ; 7 
3) EL, = y rie) , P > 1, norme de Hôlder ou l,-norme ; 


4) IE, = max l£‘ |, norme cubique ou c-norme. 


Si l’on introduit dans l’espace arithmétique un produit scalaire en exi- 
geant que la base formée des colonnes de la matrice unité soit orthonor- 
mée, on a pour tout x 


1/2 
VE, E) = (5 He) | 


i 


Il s'ensuit en vertu des propriétés du produit scalaire, que la norme eucli- 
dienne (resp. unitaire) vérifie tous les axiomes de la norme. 

Le lecteur peut vérifier facilement les axiomes pour la /-norme et la 
c-norme. Pour la norme de Hôlder, nous ne vérifierons pas les axiomes car 
cette norme ne se présentera pas dans notre exposé. 

Dans un espace vectoriel quelconque, on peut utiliser les mêmes normes 
si l’on y fixe une base et qu’on associe à chaque vecteur l’une des normes 
mentionnées plus haut de sa colonne de coordonnées. Il va de soi qu'une 
norme ainsi construite dépend du choix de la base. 
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Pour toute norme sur l’espace vectoriel Æ# on peut considérer un 
ensemble de transformations linéaires conservant cette norme, c’est-à-dire 
satisfaisant à la condition HA(x)l = Ixh. Pour la norme euclidienne (resp. 
unitaire) ce sont des transformations orthogonales (resp. unitaires). 

Appelons sphère unité dans un espace normé l’ensemble des vecteurs 
dont la norme est égale à l’unité. 


PROPOSITION 1. Etant donné la sphère unité dans un espace normé, on 
peut calculer la norme de tout vecteur. 


En effet, tout sous-espace unidimensionnel 4 coupe la sphère unité 
car sixeAonax, = Ixl-!xe Z{ N ./ Par ailleurs, tout vecteur y € 
€ diffère du vecteur x, € . "par un facteur numérique. On peut mainte- 
nant noter que Ayil = FAX I = IA. 

On a représenté fig. 52 les sphères unités dans l’espace bidimensionnel, 
qui correspondent à diverses normes. Les normes octaédrique et cubique 
s’appellent ainsi parce que pour rn = 3 les sphères unités correspondantes 
sont respectivement un octaëdre et un cube. Laissons au lecteur le soin de le 
vérifier. 


lxlé+tylé =) 
lx12+1y12=1 


Ixl+lyli=1 


maxlxl,1y1} =1 


Fig. 52. 


On comprend facilement que par exemple la norme octaédrique n’est 
engendrée par aucun produit scalaire. Sa sphère unité possède des proprié- 
tés de symétrie absolument différentes de celles d’une sphère ordinaire. 
Aussi la présence d’un produit scalaire engendrant cette norme contredit- 
elle le théorème de l’isomorphisme des espaces euclidiens. On n’entrera pas 
dans le détail de cette démonstration. 

Considérons pour deux vecteurs x, et x, de l’espace normé un ensemble 
de tous les vecteurs de la forme 


y = ax, + (1 — a)x,, 


où « est un nombre quelconque du segment [0, 1]. Cet ensemble de vecteurs 
s'appelle segment d’extrémités x, et x,. 
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Quelle que soit la norme, la boule unité, c’est-à-dire l’ensemble des vec- 
teurs dont la norme ne dépasse pas l’unité, possède la propriété suivante. 


PROPOSITION 2. Si les extrémités x, et x, d’un segment appartiennent à la 
boule unité, il en est de même de tout vecteur du segment. 


En effet, en vertu de l’axiome 3 de la norme, on a pour tout vecteur du 
segment 


Di < alx,E + (1 — œ)x, h, 


ce qui démontre l’assertion. 

Les ensembles possédant la propriété énoncée par la proposition 2 sont 
appelés convexes. D’où la dénomination du troisième axiome. 

Il ressort par exemple de la proposition 2 que l’astroïde, courbe d’équa- 
tion x23 + y23 = 1, n’est le cercle unité pour aucune norme sur le plan. 

3. Equivalence de normes. Soit $ une norme sur l’espace vectoriel Æ. 
Si æ est un nombre réel strictement positif, la fonction ÿ(x) telle que 
Y(x) = aw(x) pour tout x e Æ, est aussi une norme. Cette norme est notée 
ag. 

Considérons deux normes # et Ÿ. On dira que la norme % majore la 
norme ÿ et on écrira Ÿ < # si pour tout vecteur x de _# est vérifiée l’inéga- 
lité ÿ(x) < w(x). Il est évident que deux normes quelconques peuvent ne 
pas être liées par cette relation. Notons © (a, €) le e-voisinage du vecteur a 
pour la norme w. Si # < #, on vérifie aisément que O (a; €) Ç O, (a, €) 
pour tousae fete > 0. 

Les normes # et ÿ sont dites équivalentes s’il existe des nombres stricte- 
ment positifs æ&, et æ, tels que 


&, 9 <V< a; @. (2) 


Il est évident que la relation d’équivalence est réfléxive, c’est-à-dire que 
chaque norme est équivalente à elle-même. Cette relation est également 
transitive : si «jp < Ÿ < ævet Bit < x < B,Y,onaaBie <x< 
< æ,B,+. En outre, il découle de (2)quea, lY <w< ar lY. Cela signifie 
que la relation d’équivalence des normes est symétrique. 

Soient & et deux normes équivalentes. Il est aisé de démontrer que 
dans ce cas pour tousae Æ# ete > 0 


€ € 
O, (=) SO, (@,E) SO, (a. =). (3) 


où les nombres &, et æ, sont définis par la relation (2). 


PROPOSITION 3. La suite de vecteurs {x,) dans 7, converge en norme Ÿ si 
et seulement si elle converge en toute norme # qui lui est équivalente. 
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DÉMONSTRATION. Posons que la suite {x,} converge vers le vecteur a en 
norme ÿ. Démontrons qu’elle converge vers a en une norme équivalente +. 
Choisissons un nombre arbitraire £ > 0. En vertu de la convergence en 
norme Ÿ, il existè un numéro K,(E/a,) tel que x, € O, (a, E/a,) pour tout 
k > Kk,(€/a.). Il s'ensuit en vertu de (3) que x, € O (a, €). Donc, le nombre 
Kk,(€/a,) satisfait à la condition de convergence en norme +. 

L’assertion réciproque découle de la proposition démontrée en vertu de 
la symétrie de la relation d’équivalence entre les normes. 

On démontre que dans un espace vectoriel de dimension finie toutes les 
normes sont équivalentes. La démonstration utilise les propriétés des fonc- 
tions continues (voir Koudriavtsev [21], t. 1, $ 19). Cependant, l’équivalen- 
ce des trois normes principales peut être montrée sans difficulté. 


PROPOSITION 4, Dans un espace arithmétique, la l-norme, la c-norme et 
la norme euclidienne sont équivalentes. 


DÉMONSTRATION. Décomposons une matrice-colonne arbitraire £ 
suivant les colonnes de la matrice unité. En appliquant les propriétés de la 
norme à cette décomposition, on obtient pour une norme arbitraire | * 


ŒEU<Y lélle;l. (4) 


Majorons le second membre en remplaçant chaque nombre lle.l par sa 
valeur maximale. En désignant max Île.Ï par æ, on obtient 


LE <a Ÿ lil = alël,. (5) 


Mais on peut aussi majorer le second membre de (4) en remplaçant chaque 
nombre |£'| par sa valeur maximale. On a 


NEN < max l£'l y lei = BI£EI,, (6) 


où B = D) le.l. Appliquons (5) à la c-norme, et (6) à la /-norme. Alors, 
puisque œ # 0,ona 
a-llEl,, < IE, < BIEN, 


ce qui démontre l’équivalence de la /-norme et de la c-norme. 
L’estimation 


1/2 
max l£'l < (5 &1) < Vn max l£'l 
t { 
! 
entraîne l’équivalence de la c-norme et de la norme euclidienne. La propo- 
sition est démontrée. On a démontré en même temps la proposition sui- 
vante. 
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PROPOSITION 5. Toute norme sur l’espace arithmétique est majorée par 
le produit de la l-norme par le nombre a, 

le produit de la c-norme par le nombre BG, 

le produit de la norme euclidienne par le nombre 6. 


PROPOSITION 6. Toute norme & est une fonction continue en chacune des 
trois normes fondamentales, c'est-à-dire que 6(E,) — w(£,) pour toute 
suite {£,] convergeant vers & ,en l-norme, c-norme ou en norme euclidienne. 

Il suffit de le démontrer par exemple pour la c-norme. Selon (1) on a 


lp(E,) ns P(E 0)! < p(Ez = £o) < BUE, E £ol.. - 


Vu que l£, — £,l., — 0, la proposition 6 découle des propriétés des suites 
numériques. 


PROPOSITION 7. Pour toute norme % il existe des nombres strictement 
positifs p, et p, tels que chaque matrice-colonne & pour laquelle IEU, = 1 
vérifie la double inégalité p, < +(E) < »,. 


Pour le démontrer, profitons des résultats fournis par l’analyse mathé- 
matique (voir Koudriavtsev [21], t. I, $ 19). La sphère unité euclidienne, 
ensemble de matrices-colonnes telles que l£Ï, = 1, est fermée et bornée en 
norme euclidienne. La fonction # est continue en norme euclidienne et, par 
suite, atteint sur la sphère les valeurs maximale et minimale. En notant », et 
p, ces valeurs, on aboutit à la double inégalité cherchée. Il reste à démon- 
trer que p, > 0. Or c’est évident, car il existe une matrice-colonne £, pour 
laquelle #(&,) = », et IE, = 1. 

On est maintenant en mesure de démontrer le théorème suivant. 

THÉORÈME 1. Dans un espace arithmétique, toutes les normes sont équi- 
valents. 


DÉMONSTRATION. On démontrera l’équivalence de toute norme # à la 
norme euclidienne. D’où, en vertu de la transitivité de la relation d’équiva- 
lence des normes, découlera l’assertion du théorème. 

Faisons correspondre à une matrice-colonne arbitraire £ # 0 une 
matrice-colonne £° telle que £ = NEÏ,£°. Alors, p(E) = El, L(E°) et selon 
la proposition 7 on peut écrire 


PIE, < e(€) < P,1El,. 


Vu que pour £ = 0 l’inégalité est évidente, le théorème est démontré. 
Etant donné que toutes les normes sont équivalentes, on reste parfois 
indifférent au choix de la norme, si bien que le lecteur pourra rencontrer 
des énoncés qui contiennent par exemple une expression : « si l’inégalité 
donnée est vérifiée en une norme quelconque... ». Or dans les calculs, il est 
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souvent fort important à quelle norme on a affaire, et la possibilité de choi- 
sir librement la norme qui convient le plus, simplifie fortement les raison- 
nements. 

4. Normes des matrices. Considérons l’espace vectoriel .#,, , des matri- 
ces à m lignes et nr colonnes. Comme dans tout espace vectoriel, on peut y 
introduire différentes normes. On s'’intéressera à celles d’entre elles qui 
sont rattachées aux normes des matrices-colonnes, ainsi qu’au fait que les 
éléments de l’espace sont des matrices. 

L’exposé qui suit traite des matrices réelles. Pour les matrices com- 
plexes, les différences qui surgissent sont évidentes et peu importantes. Par 
exemple, on remplace la norme euclidienne par la norme unitaire, les 
matrices orthogonales, par les matrices unitaires. 


DÉFINITION. On dit que la norme sur .#, , est compatible ou concor- 
dante avec les normes sur les espaces arithmétiques A, et À, si pour toute 
matrice À et toute matrice-colonne £ e #, on a 


RAEU < RADIEN. (7) 


AË et £ sont ici des matrices-colonnes à m et n éléments respectivement, 
dont les normes sont choisies dans les espaces #, et #. 

Montrons sur un exemple qu’il existe des normes compatibles. A cet 
effet, considérons la fonction d’une matrice 4e .#,,, 
lag 

IA 

Vu que LAEÏ/IEÏ = LAZ£ON, où £9 = NEN-'£, la fonction & peut être 

écrite également sous la forme 
p(A) = sup LAN. (9) 


(A) = sup ——— (8) 


PROPOSITION 8. La fonction (8) est une norme sur .#,, ,, qui est compati- 
ble avec toutes les normes sur #,, et #,. 


L’existence de la borne supérieure sera établie si l’on démontre que le 
rapport LAE&Ï/IER est majoré. En utilisant le théorème 1, on peut écrire 


LAEI < al AR, = à D) D ait < a max || y l'ail = 


= BREN, < VIE. 


D'où HAEÏ/IEN < - 

Vérifions les axiomes de la norme. 

1) L'expression lA£Ï/IER est positive et, par suite #ÿ(4) > 0. Ceci 
étant, (A) = O0 si et seulement si LAER = 0 pour tous les £. Or la condi- 


$ 3] ESPACES NORMÉS 315 


tion HA£Ï = 0 est équivalente à A£ = 0 et est satisfaite pour tous les £ si et 
seulement si À = ©. 

2) L'identité (XA)£ = A(AË) entraîne I(XA)EÏ = IX - LA. Il n’est 
pas difficile de démontrer, en utilisant la définition de la borne supérieure, 
que la multiplication de tous les éléments de l’ensemble par un nombre 
positif entraîne celle de la borne supérieure de l’ensemble par ce nombre : 
sup IATLAEN = II sup lA£Ï. On a ainsi démontré que la fonction 


#(A) possède la propriété d’homogénéité positive. 
3) Pour tous 4, Bet Il = 1,ona 


1(CA + B)EN = VAE + BEI < LAN + IBE£H. 
On peut aussi démontrer la propriété générale de la borne supérieure, soit : 
su + = su + su : 
upe G + q) = sup (p) up (g) 


si P et Q sont des ensembles de nombres réels (voir Koudriavtsev [21], t. I, 
p. 26, ex. 1). | 

Ainsi donc, la fonction (8) est une norme. Démontrons qu’elle est com- 
patible avec les autres normes. En effet, pour £ # 0 on a par définition de 
la borne supérieure I AEN/IEÏ < (4), d’où LAENI < &(A)IEN. 


DÉFINITION. La norme sur Mn à définie par la formule (8) s’appelle 
norme induite par les normes sur les espaces #,, et #., ou tout simple- 
ment, norme induite. 


PROPOSITION 9. Toute norme compatible majore la norme induite. 


En effet, toute norme compatible de la matrice À majore le rapport 
I(AËEÏ/IE. Or la borne supérieure est le plus petit des majorants, de sorte 
que la norme induite de la matrice À ne dépasse aucune de ses normes com- 
patibles. 

Définissons deux propriétés importantes des normes de matrices. Si une 
norme sur l’espace des matrices carrées .# a Est telle que IEÏ = 1, on dit 
qu’elle « conserve l’unité ». Il est aisé de voir que pour toute norme sur 
# , il existe une norme de la forme c# et une seule qui possède cette pro- 
priété. 

Les normes sur l’espace A Qui satisfont pour tous À et B à la condi- 
tion 

LABI < AI - BA, (10) 


sont dites matricielles ou annulaires. On utilisera le dernier terme, quoique 
moins employé, pour éviter des expressions ambiguës quand une norme de 
la matrice n’est pas une norme matricielle. La condition (10) sera appelée 
propriété annulaire d’une norme. 
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On constate facilement que pour des normes annulaires on a RAÏ < 
< EI - RAÏ, d’où 


JEN > 1. (11) 


En outre, il découle de la propriété annulaire que 
AXE < TAN (12) 


pour tout k entier naturel, et que 
LA=!Ù > LAI-!. (13) 
Démontrons maintenant la proposition suivante. 


PROPOSITION 10. Toute norme induite sur Æ#, conserve l'unité et possède 
la propriété annulaire. 


La première partie de la proposition est évidente. La seconde découle de 
la majoration suivante où on utilise encore une fois la propriété de la borne 
supérieure, appliquée lors de la démonstration de la proposition 8 : 


lLABI = sup HA(BE)I < sup LAN -HIBEI = NA sup BEI = 
Em] IEl=] IEl=] 


= JAN: BI. 


Fixons l’attention sur le fait que l’inégalité (10) peut aussi se vérifier 
dans un cas plus général. Il suffit d'admettre que les matrices À et B soient 
rectangulaires et que leur produit soit defini (par exemple, À € Mn BE 
€ 4, ,). Dans ce cas, les normes sur trois espaces matriciels #7, ,, #7, ,et 
M, peuvent être rendues compatibles de façon à avoir 


LABI,, < IAL : IBl.. (14) 


Cette propriété de compatibilité sera également appelée propriété annu- 
laire. En particulier, pour / = 1, la propriété (14) marque la compatibilité 
de la norme Ï * |, avec les normes Îl# E,, et l* Î,,, sur les espaces arithméti- 
ques. 

En examinant la démonstration de la proposition 10, on s’aperçoit 
qu'on peut énoncer la proposition suivante. 

PROPOSITION 11. L’inégalité (14) se vérifie pour toutes matrices de dimen- 
sions appropriées si les normes W*h,, et xl, sont induites, et que la 
norme À xl, soit compatible. 


En rapport avec la définition de la norme induite, un intérêt naturel 
apparaît pour la borne inférieure 
lA£I 


et (15) 


g(A) = . 
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Elle existe car l’ensemble des nombres de la forme l'A£I/I£H est minoré 
par zéro. 

Supposons que À est une matrice carrée et qu’on prend pour les 
matrices-colonnes ÎEN et ILA£Ï la même norme. On a alors la 


PROPOSITION 12. Soit x /a norme induite. Si det À # 0, g(A) = 
= (14 -N)=!. Mais si det A = 0, g(4) = 0. 


DÉMONSTRATION. Si det À # 0, l’expression (15) peut être mise sous la 
forme inf (Iæl/1A -'æll), où # = AË£. Remarquons ques # 0. Il faut 
ensuite se référer à la propriété suivante des bornes inférieures et supérieu- 
res d’ensembles numériques : si P est un ensemble de nombres strictement 
positifs et Q l’ensemble de tous les nombres de la formep-!,oùpeP,ona 
inf Q = (sup P)-!. Laissons au lecteur le soin de le vérifier. Il s’ensuit 

LA -'æl \-! 
Au (sug Il | 


de sorte que la première assertion est démontrée. 

La seconde assertion est évidente car inf HA£Ï/IE£N > O0. Mais pour 
det À = 0, il existe une matrice-colonne non nulle £, pour laquelle A£, = 
= (. 

S. Normes de matrices les plus usuelles. Voyons quelles normes sont 
induites sur l’espace des matrices par les normes sur les espaces arithméti- 
ques que nous avons passées en revue au point Î. 

a) Supposons que dans les espaces arithmétiques on a choisi les normes 
euclidiennes (ou unitaires). La norme induite par ces dernières est appelée 
norme spectrale de la matrice. C’est 

LA ZI 

sup NTTE ; 

Es El 
Dans la proposition 10 du $ 2 on a vu que pour les matrices carrées cette 
borne supérieure est atteinte et qu’elle est égale au nombre singulier maxi- 
mal de la matrice À. On verra plus bas que cette propriété est aussi vérifiée 
pour les matrices rectangulaires, mais d’abord démontrons la proposition 
suivante. 


PROPOSITION 13. La norme spectrale d’une matrice ne varie pas quand on 
multiplie cette matrice à droite ou à gauche par une matrice orthogonale 
(resp. unitaire). 

DÉMONSTRATION. La multiplication d’une matrice-colonne par une 
matrice orthogonale ne modifie pas sa norme euclidienne : HUE = IE. I 


en découle que la norme spectrale d’une matrice orthogonale (resp. uni- 
taire) vaut 1. Maintenant, en vertu de la proposition 4, on peut écrire 


IUAN < IUT - LAN = RAÏ 
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É LAN = IU-TUAI < IU-1: IUAI = UAI, 
ce qui démontre l’assertion pour les facteurs à gauche. Pour les facteurs à 
droite la démonstration est presque la même. 

Pour calculer une norme spectrale, on peut se servir de la proposition 
13 et du théorème 1m, $ 1, qui permettent de réduire le calcul de la norme 
spectrale d’une matrice À de type (m, n) à celui d’une matrice À ‘ de la 
forme (comp. (17), $ 1) : 


D O 
“2 
O O 


D, est ici une matrice carrée diagonale d'ordre r = Rg À, sur la diagonale 

de laquelle se trouvent les nombres singuliers non nuls &; de la matrice À. 

Ceci étant, ils sont numérotés de façon à avoir a, > «, > … 2 «@,. 
Considérons une matrice-colonne £ e #,. Pour cette dernière, 


nn 1/2 r 
IEN = (5 En») et NA'EI = (S Qt?) 


D'où, en remplaçant &,, …, a, par «,, on obtient |A ER/KEÏ < a,, l’éga- 
lité étant vérifiée si£ = ‘1, 0, …, ON. Ainsi donc, on a démontré la 


PROPOSITION 14. La norme spectrale d'une matrice est égale à son nom- 
bre singulier maximal : VAR = a. 


1/2 


Pour une matrice carrée régulière, on obtient de la proposition 12 et de 
la proposition 10 du $ 2, que. 


LA -IN = a7!, (16) 
où a, est le nombre singulier minimal (pour det À # 0, il n’est pas nul). 


b) Admettons qu'on a choisi les /-normes sur #, et %,. Majorons 
LA£I, pour la matrice-colonne &£ # 0 : 


IAE, = DZ dé < D (E lei )isti < 
J k k J 
< (max y 1) S IE 1. 
Ainsi donc, | ° 
MAG ax y la | 
FT SE k'- 


Montrons que l'égalité est possible ici. Supposons que le maximum est 
atteint pour la valeur Æ = s. Choisissons pour matrice-colonne £ la s-ième 
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colonne de la matrice unité d’ordre nr. AË est alors la s-ième colonne de la 
matrice À et sa /-norme vaut 


lAel, = Ÿ læl. 
J 
Vu que lle,l, = 1,ona l4el,/lel, = Ÿ lol = max L''a . Donc, 


J 
la norme induite par les /-normes sur les espaces sn ihéique est la norme 


LAN, = max D la. |, 
J 


c’est-à-dire la somme maximale parmi les sommes des modules des élé- 
ments de chaque colonnes de la matrice, autrement dit le maximum des 
l-normes des matrices-colonnes. 

c) Supposons qu'on a choisi les c-normes sur #,, et ,. Majorons 
LA&L, pour la matricecolonne £ # 0 : 


AEL,, = max < max ) CAR 
€ (max lH)mr E 
k 
D'où 
Fi < max y la |. 


k 


Montrons que l'égalité est ici possible. Posons que le maximum est atteint 
pour la valeur & = s. On exige que le s-ième élément de la matrice-colonne 
= AË soit égal à 


Il suffit pour cela de choisir £ de manière que pour tous les £ soit vérifiée 
l'égalité aÿ£* = lai l. Il est évident que c’est toujours réalisable et que de 
plus PEL, = 1. Ensuite, pour toute matrice-colonne on a ji Iml > n°, 


de sorte que 


max pl > Y lal = max ÿ 
J 
k 


k 
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ce qui avec la majoration précédente donne 


pee = max y læl. 
Ka k 


Donc, la norme induite par les c-normes sur les espaces arithmétiques est la 
norme 


lAL, = max D lail, 


c’est-à-dire la somme maximale parmi les sommes des modules des élé- 
ments de chaque ligne de la matrice. 

On peut mettre toute matrice à 1 lignes et nr colonnes sous forme de 
matrice-colonne à mn éléments et considérer pour ces matrices les mêmes 
normes qu’on a définies pour les matrices-colonnes au point 2. Dans ce cas, 
n’étant pas induites, ces normes ne possèdent pas obligatoirement les pro- 
priétés utiles des normes induites. 

d) Norme euclidienne de la matrice réelle et norme unitaire de la matrice 
complexe. On pose par définition 


_ \12 
LAN, = (5 CI 
uj 


L'élément de la matrice 44 rangé dans la i-ième ligne et la j-ième colonne 
est 


y did; - 
k 


On en tire que le carré de RAI E ©St égale à la trace de "44, c’est-à-dire que 
HAN, = Vtr ‘AA. 


De façon analogue, on démontre que la norme unitaire d’une matrice com- 


plexe est 
AU, = Vtr ‘44. 


Dans la suite, on ne traitera que des matrices réelles en laissant au lecteur le 
soin de reporter les résultats obtenus sur les matrices complexes. 
L'expression obtenue pour IAÏ, justifie la proposition suivante. 


PROPOSITION 15. La norme euclidienne de la matrice est égale à la racine 
carrée de la somme des carrés de ses nombres singuliers. 


PROPOSITION 16. La norme euclidienne de la matrice À ne varie pas 
quand on multiplie À à droite ou à gauche par une matrice orthogonale. 
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DÉMONSTRATION. Si U est une matrice orthogonale, on a 
tr (UA)UA = tr 'A'UUA = tr 'AA. 
La norme euclidienne étant invariante par transposition, on a aussi 
AU, = M(AUM, = MU'AN = MAN = NAN... 


On achève ainsi la démonstration de la proposition. 

La norme euclidienne possède la propriété annulaire : si le produit des 
matrices À et B est défini, RABI, < LAN IBN,. 

En effet, en vertu de l’inégalité de Cauchy-Bouniakovski, 


2 
2 2 
(5 abs) < Lai L bk 
J J J 
pour tous i et k. En sommant ces inégalités suivant tous ji et k, on obtient 
1ABI£ < IAIZIBIZ, d’où l’expression nécessaire. 


Il s'ensuit, en particulier, que la norme euclidienne est compatible avec 
les normes euclidiennes sur les espaces arithmétiques : 


AE, < LAINE. 
Il n’existe pas de norme sur l’espace arithmétique qui puisse induire une 


norme matricielle euclidienne. En effet, LE, = Vn. 
e) La norme LAÏ = max la; ne possède pas la propriété annulaire tout 
1, 


en conservant l’unité. On utilise beaucoup plus souvent dans l’espace des 
matrices carrées d'ordre ñn la norme suivante 


LAN. = n max la]. 
i, j J 
Elle possède la propriété annulaire et est compatible avec les trois normes 
principales sur les espaces arithmétiques. Démontrons-le. 


L'élément du produit 4B peut être majoré en module de la façon sui- 
vante : 


j ab 


J 


i i 
< Ÿ lallbil < max lail SO Ib{£l < 


J J 


< n max la! max lb 1. 
1,9 J 4.4 k 


Cette majoration a lieu également pour l'élément de AB maximal en 
module. En multipliant les deux membres de l’inégalité par n, on obtient 
LAB1.. < 1AÏ.1Bl_.. On a démontré ainsi la propriété annulaire. 

Vu que n° (max la;;l Ÿ est supérieur à la somme des carrés de tous les 


éléments de la matrice, la norme considérée est supérieure à la norme eucli- 


21 —6442 
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dienne. On a vu que la norme matricielle euclidienne est compatible avec la 
norme euclidienne sur .:#,. Par suite, la norme ll * |. est aussi compatible 
avec la norme euclidienne sur .# . 

D'une façon analogue, la norme ll * l_. est supérieure aux normes indui- 
tes par la /-norme et la c-norme, et, par suite, est compatible avec la 
l-norme et la c-norme sur .#,. 


f) La norme y lai ne nous intéressera pas. Notons que la norme 


4, 1 


ee 
D lai conserve l’unité. 


1.) 

6. Convergence en éléments. On étudie pour les suites dans l’espace 
arithmétique la convergence en éléments (ou en coordonnées). La suite [£,] 
converge en éléments vers £, si les suites formées d’éléments des matrices- 
colonnes £, convergent vers les éléments correspondants de la matrice- 
colonne £, : 


im E =E, i=ln. 
| — O0 


D'une façon plus détaillée, cela signifie que quels que soient les nombres 
strictement positifs €,, .…., €, il existe des numéros &;(e,), .…, &,(e,) tels 
que pour tous les i = 1, …, n l'inégalité IE! — £il < €; se vérifie si & > 
> K;(E,). 

On remarque aussitôt que la convergence en éléments se confond avec 
la convergence en c-norme. En effet, si la suite converge en éléments, choi- 
sissons un € > 0 quelconque et posons €, = .. = €, = €. Dans ce cas, on 
aura alors pour &# > max &;(e) l'inégalité max l£! — El < €, ce qui équi- 

{ 


vaut à la convergence en c-norme. L’assertion réciproque est aussi évi- 
dente. 

Du théorème 1 et de la proposition 3 il découle maintenant que la suite 
converge en éléments si et seulement si elle converge en une norme quelcon- 
que. 

Tout ce qui a été dit plus haut se rapporte aussi à la convergence en élé- 
ments d’une suite de matrices. En écrivant les éléments de la matrice de 
type (7, n) en une colonne à mn éléments, on peut considérer l’espace 
y, A COMme un espace arithmétique et formuler le résultat suivant. 

La suite de matrices À, converge vers la matrice 4, en éléments si et 
seulement si elle converge vers À, en une norme quelconque. 


CHAPITRE XII 


THÉORÈME DE JORDAN. FONCTIONS DE MATRICES 


$ 1. Polynômes annulateurs 


1. Divisibilité des polynômes. On rappellera ici les propriétés élémentai- 
res de divisibilité des polynômes d’une variable, nécessaires à l’exposé ulté- 
rieur. Les polynômes à coefficients complexes (resp. réels) constituent un 
espace vectoriel complexe (resp. réel) relativement aux opérations habituel- 
les d’addition et de multiplication par un nombre. L'élément nul de cet 
espace est le polynôme identiquement, nul, autrement dit le polynôme dont 
tous les coefficients sont nuls. On l’appellera plus loin polynôme nul ou 
polynôme égal à zéro. 

Outre les opérations linéaires, l’ensemble des polynômes est muni de 
l'opération de multiplication. Notons que la multiplication par un nombre 
se confond avec la multiplication par un polynôme de degré nul dont le 
terme constant est égal à ce nombre. 

Soient les polynômes g et p. Admettons qu’il existe des polynômes h et r 
tels que g = hp + ret le degré de r est strictement inférieur à celui de p. 
On dit alors que h est le quotient de q par p, et r est le reste. 

Si le reste de la division de g par p vaut zéro, c’est-à-dire s’il existe un 
polynôme h tel que g = hp, on dit que g est divisible par p ou que p est le 
diviseur de q. 


PROPOSITION 1 (THÉORÈME DE BÉZOUT). Le polynôme p est divisible par le 
binôme t — u si et seulement si p (u) = 0. 


Le reste r de la division de p par { — Lu est de degre strictement inférieur 
à celui de ? — u, c’est-à-dire est une constante. En portant y dans l’égalité 
p = h(t —- p) + r,ontrouver = p (u), d’où la proposition à démontrer. 

DÉFINITION. On dit que le polynôme d est le plus grand commun diviseur 
des polynômes p,, …, p, s’il divise chacun d’eux et se divise par tout autre 
diviseur commun à ces polynômes. 

Le plus grand commun diviseur des polynômes p,, .…, p, est noté 
PGCD (p,, …, p,). Les polynômes p,, …, p, sont dits premiers entre eux si 
le PGCD (p,, .…, p,) est de degré 0. 


PRoPosITIiON 2. Pour que les polynômes complexes p,, …, p, ne soient 


21" 
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pas premiers entre eux il faut et il suffit qu'ils possèdent une racine com- 
mune. 

La nécessité de la condition est évidente, tandis que la suffisance 
découle directement du théorème de Bézout. 


PROPOSITION 3. Soient p,, …, p, des polynômes dont l'un au moins est 
différent de zéro et d = PGCD (p,, …, p.). Il existe alors des polynômes 
U,,.., U, tels que 


d' = up, +... + u,p.. (1) 


DÉMONSTRATION. Notons ./ l’ensemble de tous les polynômes de la 
forme f,p, + … + f.p,, où f,, .…, f. sont des polynômes. possède les 
propriétés suivantes : 

a) Sig,he./onag+he.” 

b) Si ge _”, alors hg e . quel que soit le polynôme h. 

Il va de soi que chacun des polynômes p,, ..…., p, appartient à .. Il 
s’ensuit en particulier que ./ contient des polynômes différents de zéro. 

Dans tout ensemble contenant au moins un polynôme non nul, ilyaun 

polynôme non nul de degré minimal. En effet, les degrés des polynômes 
sont des nombres entiers positifs et par suite, dans l’ensemble de degrés des 
polynômes non nuls il existe un élément minimal. Soit d = u,p, + ... + 
+ up, un polynôme non nul de ./’de degré minimal. Alors d'est le diviseur 
de tout polynôme g de . 7 En effet, soit g = hd + retr # 0. Dans ce cas, 
r = g — hdet, par suite, r se trouve dans . avec g et d. Or le degré de rest 
strictement inférieur à celui de 4, ce qui contredit le choix de d. Donc, 
r = Oet d'est le diviseur de tout polynôme de. en particulier des polynô- 
mes D,, .…., D... 

Supposons maintenant que d, est un diviseur commun aux polynômes 
Pis --., P,. Alors d, est le diviseur de tous les termes du second membre de 
l’égalité (1) et donc le diviseur de 4, ce qui achève la démonstration. 


COROLLAIRE. Les polynômes p,, .…, p, Sont premiers entre eux si et seule- 
ment s'il existe des polynômes u,, .…, u, tels que 


UP, +. + Up, = 1. 


DÉFINITION. Soient donnés des polynômes non nuls p,, .…, p,. On dit 
que le polynôme g est un multiple commun à ces polynômes s’il est divisi- 
ble par chacun d'eux. Le multiple commun aux polynômes p,, .…, p, 
s’appelle /e plus petit commun multiple s’il est le diviseur de tout autre muil- 
tiple commun à ces polynômes. 

Le plus petit commun multiple des polynômes p,, .…, p, est noté 
PPCM (p,, …, p.). 


PROPOSITION 4. Le multiple commun q des polynômes p,, …, p, est leur 
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plus petit commun multiple si et seulement si les quotients de q par 
Pis +. D, SOnt premiers entre eux. 


DÉMONSTRATION. Pour tous les i = 1,...,s, les quotients h; sont définis 
par les égalités g = h,p.. Si d = PGCD (h,, .…, h,) est un polynôme de 
degré non nul, il existe des polynômes /,, .…, f. tels que pour tous les i = 
= 1,...,s sont vérifiées les égalités g = f.dp.. Donc, g se divise par d. En 
désignant le quotient par g'’,onaf,p, = … = f.p, = q°. Cela signifie que 
g” est un multiple commun aux polynômes p,, …, p,. Son degré est stricte- 
ment inférieur à celui de g et, par suite, il ne se divise pas par g. Donc, q 
n’est pas le plus petit commun multiple. 

Inversement, soit g* un multiple commun aux polynômes p,, …, p, 
mais non pas le plus petit. Son degré est alors strictement supérieur à celui 
de g = PPCM (p,, …, p,). En effet, g* se divise par g et par suite, son 
degré ne peut être strictement inférieur à celui de g. Si les degrés de g* et de 
q étaient égaux, alors pour la même raison g* différerait de q par un fac- 
teur numérique. Dans ce cas, g* serait de même le plus petit commun mul- 
tiple contrairement à l’hypothèse. 

Ainsi donc, il existe un polynôme f de degré non nul, tel que g* = /q. 
On peut maintenant écrire pour chaque ÿ que g* = fh;p,, où h; est le quo- 
tient de g par p.. Il en découle que les quotients de g* par p. possèdent un 
diviseur commun de degré strictement positif. La proposition est démon- 
trée. 

2. Polynômes de transformations. Considérons un espace vectoriel Z 
de dimension n sans préciser pour l'instant si c’est un espace réel ou com- 
plexe. Rappelons (voir point 6, $ 3, ch. VI) que pour les transformations 
linéaires de l’espace /, on a défini les opérations d’addition, de multiplica- 
tion par un nombre et de multiplication des transformations. En particu- 
lier, on a défini l’opération d’élévation d’une transformation linéaire à une 
puissance positive entière. Introduisons une définition complémentaire 
selon laquelle chaque transformation linéaire de puissance nulle est égale à 
la transformation identique E de l’espace =. 

Cela nous permet de porter une transformation linéaire À, en tant 
qu’une valeur de la variable f, dans tout polynôme p : 


PA) = @E + a A + A? + … + a, An. 


Il va de soi que la valeur obtenue p (A) du polynôme p sera aussi une trans- 
formation linéaire de l’espace Z,. L'image d’un vecteur x par cette trans- 
formation sera notée p(A) (x) ou pA(x). La valeur du polynôme sur la 
transformation À est appelée tout simplement polynôme de la transforma- 
tion À. 

L'espace 7 étant rapporté à une base, toute transformation À possède 
une matrice À. Vu qu’aux opérations sur les transformations correspon- 
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dent les mêmes opérations sur leurs matrices, la transformation p (A) sera 
définie par la matrice 


P(A) = QE + a, À + @) A? Fous FO AT. 


Les expressions de cette forme sont appelées polynômes matriciels. 

L’addition, la soustraction et la multiplication des matrices possèdent 
les mêmes propriétés principales que les opérations sur les nombres, à 
l’exception de la commutativité de la multiplication. Vu que pour déduire 
les propriétés des polynômes numériques on n’est pas obligé de diviser par 
une variable indépendante, le besoin d’inverser les matrices ne se présente 
pas. Notons que pour multiplier les polynômes matriciels, il s’avère néces- 
saire de multiplier les puissances d’une même matrice, lesquelles sont com- 
mutables : A'A5 = AsAî = Aîts, 

Il s'ensuit que les opérations algébriques sur les polynômes matriciels 
d’une même matrice À ou de matrices commutables sont douées des mêmes 
propriétés que les opérations sur les polynômes numériques. Il va de soi 
que cette affirmation s’étend aux polynômes de transformations. 

Rappelons que le noyau d’une application (en particulier, d’une trans- 
formation) est l’ensemble des vecteurs dont l’image est le vecteur nul. Le 
noyau de la transformation À est un sous-espace vectoriel noté Ker À. 
L’ensemble des valeurs A(_Z ) de la transformation À est noté Im À. 


PROPOSITION S. Pour toutes transformations À et B on a KerA € 
C KerBA. En particulier, KerA © KerAË, avec k > 1. 
En effet, si x e Ker À, on a A(x) = o et BA(x) = o. 
La proposition S entraîne la formule suivante : si g est un multiple com- 
mun aux polynômes p,, …, p,,ona 
Kerp,(A) © Kerg(A) 
pour tous les : = 1, ...,Ss. 


Si chacun des sous-espaces Ker p.(A) est inclus dans Kerg(A), il en est 
de même de leur somme. Donc, 


D) Kerp.(A) © Kerg(A). (2) 
il) 


PROPOSITION 6. Si q = PPCM (p,, .…, p,), il vient 
y Kerp.(A) = Kerg(A). 


Etant donné la formule (2), il nous reste à démontrer que chaque vec- 
teur de Kerg(A) se décompose en une somme de vecteurs x,, .…, x, tels que 
x, e Kerp.(A). 
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Pour le démontrer, notons h; le quotient de la division du polynôme q 
par le polynôme p.. En vertu de la proposition 4 et du corollaire de la pro- 
position 3, il existe des polynômes u,, .…, u, tels que 1 = h,u, + … 
… + h,u,. Cela signifie que la transformation identique E se décompose en 
une somme de produits : 


E = u,(A)h,(A) + … + u,(A)h, (A). 


Appliquons les deux membres de cette égalité à un vecteur arbitraire x de 
Ker g(A). On obtient x = x, + … + x,, où x; = u,(A)h.(A) (x). 

Démontrons que x. e Kerp,(A). En effet, si on substitue p A à p.(A) 
pour rendre les notations plus compactes, on pourra écrire 


pÂ(x,) = pluAhA(x) = uñqA(x) = 0, 


ce qui démontre la proposition. 

Soit d'un diviseur commun aux polynômes p,, .…, p,. Cela signifie que 
pour tout j il existe un polynôme h; tel que p, = h,d. Donc, la proposition 5 
montre que Ker d(A) est inclus dans chacun des sous-espaces Ker p.(A) et, 
par suite, dans leur intersection : 


Kerd(A) © fn Kerp.(A). (3) 
il 


PROPOSITION 7. Si d = PGCD (p,,...,p,),ona 


Kerd(A) = f( Kerp.(A). 


1=i 


En vertu de la formule (3), il ne reste qu’à démontrer que chaque vec- 
teur de l’intersection des espaces Kerp;(A) appartient à 'Ker d(A). Pour le 
démontrer, écrivons d sous forme de d = u,p, + .… + u,p,. D'où dÂ = 
= uApÂ + … + uApÂ. Appliquons les deux membres de cette égalité à un 
vecteur arbitraire x de l’intersection. Il vient 


dA(x) = uAp(x) + … + uApA(x) = o, 
ce qui est équivalent à l’assertion à démontrer. 


Si les polynômes p,, .…, p, sont premiers entre eux, d(A) = E. Or 
KerE = o, de sorte que la proposition 7 permet dénoncer le 


COROLLAIRE. Pour des polynômes premiers entre eux on a 
$ 
\ Kerp,(A) = o. 
1.1 


$ 
3. Polynôme annulateur minimal d’une transformation. La transfor- 
mation © d’un espace vectoriel _# est dite nulle si elle associe à chaque vec- 
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teur le vecteur nul. Ceci est équivalent au fait que le noyau de la transfor- 
mation nulle se confond avec l’espace tout entier. 


DÉFINITION. Un polynôme non nul p sera appelé polynôme annulateur 
de la transformation A si p(A) = O. 

Il est évident que p est le polynôme annulateur de la transformation À si 
et seulement si Ker p(A) = #. 

Quelle que soit la base de l’espace # , la transformation nulle est défi- 
nie par la matrice nulle ©. Par suite, la matrice À de la transformation A 
vérifie l'équation p(A4) = O si et seulement si p est un polynôme annula- 


teur de À. 


PROPOSITION 8. Pour toute transformation linéaire À il existe un poly- 
nôme qui l'annule. 


DÉMONSTRATION. Soit À la matrice de la transformation À dans une base 
quelconque. Parmi les puissances entières positives de la matrice À ilyena 
au plus 7? qui sont linéairement indépendantes, car en général il existe au 
plus 7? matrices linéairement indépendantes d’ordre n. Soient ps cer Un 
les coefficients d’une combinaison linéaire non triviale et égale à zéro des 
puissances de la matrice 4. Alors, 


QE + @A + … + a, A" = O, 


ce qui achève la démonstration. 

En parlant des polynômes annulateurs, on se place dans une situation 
différente de celle adoptée en algèbre élémentaire. On s’y intéresse à des 
racines du polynôme donné, tandis qu’ici on considère l’ensemble des poly- 
nômes dont les valeurs sur la transformation donnée A sont nulles. 

L'ensemble # de tous les polynômes annulateurs de la transformation 
donnée A possède les propriétés suivantes qui sont faciles à vérifier : 

a) Sig, he Z,alorsg +hEe 7. 

b) Sig e .#, alors gh e # quel que soit le polynôme h. 

Ce sont les mêmes propriétés que celles de l’ensemble ./qu’on vient de 
définir lors de la démonstration de la proposition 3. En partant de ces pro- 
priétés, on a démontré que l’ensemble considéré contient un polynôme de 
puissance minimale qui divise tous les autres polynômes. Le même raison- 
nement aboutit à la proposition suivante. 


ProPosiTiON 9. Parmi les polynômes annulateurs de la transformation À 
il existe un polynôme de puissance minimale qui divise tous les polynômes 
annulateurs de À. Ce polynôme est défini à un facteur numérique près. 


DÉFINITION. Le polynôme décrit dans la proposition 9 est appelé poly- 
nôme minimal de la transformation À si son coefficient dominant est 1. 
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ExEMPLE. Soit la transformation A définie dans une base par la matrice 
matrice 


© OO © — 
OS © — 
© ND © 
D © © 


Démontrons que le polynôme 1? — 31 + 2 = (t — 1)(1 — 2) est le poly- 
nôme minimal de la transformation À. En effet, c’est un polynôme annula- 
teur, car 


0 0 0 0 — | 0 0 0 
0 0 O0 O© 0 —1 0 0 

= — 2 = = O0. 

CAE TUENS di 0 O0 1 O0 0 0 0 O0 ° 
0 0 O0 1 0 0 0 0 


S'il existait un polynôme annulateur du premier degré { — a, la matrice À 
devrait vérifier l’égalité À — œÆ = O, d’où on aurait « = 1 et « = 2. 

4. Transformations nilpotentes. DÉFINITION. La transformation linéaire 
B de l’espace vectoriel .#est dite nilpotente si son polynôme minimal est de 
la forme f/. Le nombre / est appelé indice de nilpotence. 

Ainsi, si / est l’indice de nilpotence, on a B/(x) = o pour tout x de .#et 
il existe un vecteur y e .#'tel que B/-!(y) + o. Il va de soi que pour cer- 
tains x il s'avère que B*(x) = o pour À < 1. 

Notons que toutes les valeurs propres d’une transformation nilpotente 
sont nulles. En effet, pour un vecteur propre x on a B’/(x) = x = o, 
d’où À = 0. Il s’ensuit que pour une transformation nilpotente B tous les 
vecteurs propres, ainsi que le vecteur nul, constituent le noyau Ker B. 


PROPOSITION 10. Supposons que B est une transformation nilpotente et 
que x est un vecteur qui satisfait pour un h aux conditions B*-\(x) # oet 
B(x) = o. Dans ce cas, les vecteurs x, B (x), .…, B#-1(x) sont linéaire- 
ment indépendants. 

Supposons que les vecteurs sont linéairement dépendants et que a:; 
(i > 0) est le premier coefficient non nul dans leur combinaison linéaire 


a,X + … + a Bi(x) + … + a,_,B-1(x) = o. (4) 


Il ressort de l’hypothèse que i < h — 1, et l’on est en droit d’étudier la 
transformation B*-'-!. Considérons les images par cette transformation 
des deux membres de l'égalité (4). On obtient æB*-!(x) = o, d’où 
a, = 0. La contradiction obtenue démontre la proposition. 

CoRoLLAIRE 1. Toute famille de vecteurs x, B(x), .…, B/(x), où B/(x) 


est un vecteur non nul, est libre car il existe une famille libre dont elle est 
partie. 
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CoRoOLLAIRE 2. L'indice de nilpotence est au plus égal à la dimension de 
l’espace. 

DÉFINITION. On appellera sous-espace cyclique relativement à la 
transformation nilpotente B l’enveloppe linéaire des vecteurs x, B(x), … 
…, B#=1(x), si B*-!(x) # oet B'(x) = o. On dira que le sous-espace 
cyclique est engendré par le vecteur x. 

En vertu de la proposition 10, les vecteurs mentionnés dans cette défini- 
tion constituent une base de l’espace cyclique. On appellera cette base base 
cyclique (engendrée par le vecteur x). 


PROPOSITION 11. Soit ÿ le sous-espace cyclique de dimension h engendré 
par le vecteur x. Alors pour r < h, le sous-espace B'( $) est cyclique. Il 
est engendré par le vecteur B'(x) et est de dimension h — r. Mais sir > h, 
le sous-espace B'( ; ) est nul. 


DÉMONSTRATION. Soit y = ax + a B(x) + … + a,_,B*-!(x) un 
vecteur quelconque de . Alors, en vertu de B/(x) = o, l’image du vec- 
teur y est de la forme B(y) = a)B(x) + … + a,_,B-1(x). Selon la 
proposition 10, les vecteurs B(x), …, B*-!(x) constituent une base de 
B( % ). Il en ressort que B( > ) est le sous-espace cyclique engendré par le 
vecteur B(x), et dim B( >) = À — 1sih > 1. En appliquant ce résultat 
successivement 7 fois, on aboutit à la conclusion recherchée. 


CoROLLAIRE. Chaque sous-espace cyclique est invariant par la transfor- 
mation B. 
En effet, de la proposition 11 on tire B(%) C %. 


$ 2. Forme normale de Jordan 


1. Sous-espaces de racines. On étudiera les espaces vectoriels com- 
plexes, bien qu’en partie les résultats obtenus se vérifient aussi pour les 
espaces réels. À proprement parler, on devra supposer que le polynôme 
minimal de la transformation linéaire étudiée admet la décomposition en 
facteurs suivante : 


pt) =(t—X)4.. (rt — À). (1) 


Les entiers naturels K,, ., &, sont ici les multiplicités des racines À,, .., À. 
Leur somme K, + .. + k, est égale au degré du polynôme minimal. On 
suppose que les racines À,, ..…, À, sont deux à deux différentes. 

Tout polynôme présente une décomposition de la forme (1) s’il est con- 
sidéré sur le corps des nombres complexes. Aussi les résultats ultérieurs se 
vérifient-ils pour toute transformation linéaire de l’espace complexe et 
pour les seules transformations linéaires de l’espace réel dont les polynô- 


mes minimaux ne possédent que des racines réelles. 
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DÉFINITION. On appelle sous-espaces de racines de la transformation À 
les sous-espaces .# = Ker(A — AE)“, i = 1,...,s, où les nombres À. et k; 
sont définis dans la décomposition (1) pour le polynôme minimal de la 
transformation A. 


PROPOSITION 1. Les sous-espaces de racines de la transformation À sont 
invariants par cette transformation. 


Chaque polynôme en À commute avec À, de sorte que le noyau de tout 
polynôme en À est invariant par À (proposition 1, $ 2, ch. XI). En particu- 
lier, cela se rapporte aux polynômes (A — À,E)“i. 


THÉORÈME 1. Si À est une transformation linéaire d'un espace vectoriel 
complexe  , alors , est la somme directe des sous-espaces de racines .#; 
de la transformation À. 


DÉMONSTRATION. Ecrivons, pour abréger, la décomposition (1) du poly- 
nôme minimal de la transformation À sous forme de p = b,b, .… b, et 
désignons par 8; le quotient de p par b; , C'est-à-dire 


8; = D, .… b;,_,b,,,... D.. 


J-1"J+1 s 
Vu qu'aucune racine n’est commune aux polynômes g,, …, g,, ils sont 
premiers entre eux. On a donc, selon la proposition 4 du $ 1, p = 
= PPCM (6,, …, b.). 
Vu que Kerp(A) = ,, la proposition 6 du $ 1 donne 


7 = y Ker b.(A) = L ee (2) 


1m] 
De façon analogue on démontre que 
Kerg, = à A. 


it 
Les polynômes b, et g; sont premiers entre eux, de sorte que selon le corol- 
laire de la proposition 7, $ 1,ona À N Kerg, = 0. Ainsi, la somme (2) est 
directe et le théorème est démontré. 

Soit e une base de l’espace _# présentant la réunion de bases des espaces 
de racines. Il est aisé de démontrer (comp. point 2, & 4, ch. VI) que, si les 
sous-espaces .# sont invariants, la matrice de la transformation À par rap- 
port à e se décompose en blocs diagonaux : 


À, 
A = 2 (3) 
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où À,, .…, À, sont des matrices carrées d'ordres m,, ..…., m, égaux aux 
dimensions des espaces de racines. De plus, m, + ... + m, = n. Les 
matrices À, (i = 1, .…, s) sont les matrices des restrictions de la transfor- 
mation À aux sous-espaces .#. 

La matrice décomposée en blocs diagonaux (3) sera notée également 
diag (A,, .…, À.). 

Le déterminant de la matrice C = diag (C,, .…, C,) est égal au produit 
des déterminants des blocs diagonaux C,, .…, C.. Pour démontrer cette 
proposition par récurrence sur l’ordre de la matrice, il suffit de développer 
le déterminant de la matrice C suivant la première ligne et appliquer l’hypo- 
thèse de récurrence à chaque mineur dans le développement obtenu. 

Utilisons ce résultat pour calculer le polynôme caractéristique de la 
transformation À. Soit À la matrice de À par rapport à une base qui est la 
réunion de bases des sous-espaces de racines. Alors 


g{A) = det (4 — XE) = Il det (A, — ÀE,,), (4) 


i=i 


où E,, est la matrice unité d’ordre m.. 


Ainsi, le polynôme caractéristique de la transformation est égal au pro- 
duit des polynômes caractéristiques qui sont ses restrictions aux sous- 
espaces de racines. 

Considérons l’un quelconque des sous-espaces de racines .Æ = 
= Ker(A — ÀE)%. Soient 4 une valeur propre de la restriction de A à ce 
sous-espace, et x le vecteur propre associé. Considérons l’image du vecteur 
x par la transformation À — X.E. Il vient 


(À — À E)(x) = A(x) — Àx = px — Àx = (nu — X,)x, 


d’où 


(A — AE)“ (x) 


ou bien, puisque x # 0, 


(u — X,)6ix = 0, 


u = à. 


I 


On voit donc que les racines du polynôme caractéristique de la restriction 
de À à .# se confondent avec \, et, par suite, ce polynôme caractéristique 
est de la forme 


PO) = (À — Ni. 
D’après la formule (4) on obtient le polynôme caractéristique de À 
qi) = À, — A. (À — NS, (5) 


d’où la proposition suivante : 
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PROPOSITION 2. L'ensemble des racines du polynôme minimal de la 
transformation À coïncide avec l’ensemble des racines de son polynôme 
caractéristique. Les multiplicités des racines du polynôme caractéristique 
sont égales aux dimensions des sous-espaces de racines. 


Notons B,; la restriction de la transformation À — À:E au sous-espace 
de racines .# correspondant à la racine À. Par définition du sous-espace de 
racines, B, est alors nilpotent et l’indice de sa nilpotence ne dépasse pas la 
multiplicité 4; de la racine À; du polynôme minimal. 


PROPOSITION 3. L'indice de nilpotence |. de la transformation B; est égal 
à la multiplicité de la racine X, du polynôme minimal. 


Supposons le contraire, soit /, < k;. Considérons le polynôme 
DE) = Œ— À)... (Œ — À)h... (ŒÆ — À) 


et l’image par la transformation D(A) d’un vecteur arbitraire x de l’espace 
,. Décomposons x en somme de vecteurs appartenant aux sous-espaces 
de racines : x = x, + .. + x,. Il vient 


DA(x) = DA(X) + … + BA(X,). (6) 


Pour calculer chaque terme de (6), portons à la dernière place dans 5 (A) le 
facteur qui annule le vecteur x. de ce terme. On montrera ainsi que tous les 
termes, dont BA(x;), sont nuls et, par suite BÂ(x) = o pour tout x de D 
Or le degré de j est strictement inférieur à celui du polynôme minimal, ce 
qui contredit la définition de ce dernier. La proposition est démontrée. 

Il découle des propositions 2 et 3 et du corollaire 2 de la proposition 10, 
$ 1, que les multiplicités des racines du polynôme minimal ne dépassent pas 
celles du polynôme caractéristique : 


K. < m.. 


{ Î 


Il s’ensuit que le polynôme caractéristique est divisible par le polynôme 
minimal, et l’on aboutit au 


THÉORÈME 2 (DE CAYLEY-HAMILTON). Le polynôme caractéristique de toute 
transformation est son polynôme annulateur. 


Ce théorème admet une traduction matricielle. 
THÉORÈME 2M. Toute matrice vérifie son équation caractéristique. 


Une démonstration simple du théorème de Cayley-Hamilton a été obte- 
nue à la suite d’une longue étude des propriétés de transformations. Le lec- 
teur désireux de connaître les différentes démonstrations de ce théorème 
peut consulter la littérature spéciale (voir, par exemple Maltsev [26)). 
Cependant, ce théorème si élégant est rarement utilisé. 

2. Chaïnes de Jordan. Dans les trois points suivants, on étudiera un 
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sous-espace de racines fixé .# et la restriction B. de la transformation 
À — ÀE à ce dernier. La valeur de i étant unique, on omettra cet indice 
pour abréger l’écriture. Ainsi donc, on considère un espace .#de dimension 
m et une transformation nilpotente B de cet espace, dont l’indice de nilpo- 
tence est K. 

On démontrera que l’espace .# se décompose en une somme directe de 
sous-espaces cycliques relativement à B. A cet effet, on construira des 
bases cycliques dont la réunion est une base dans .#: 

Soient B*(x) 4 o, B**!(x) = o pour un vecteur x. Introduisons les 
notations suivantes pour les vecteurs de la base cyclique : 


B#(x) = e°, B!-!(x) = e!,...,B(x) = e*-!, x = ef. 


Il est aisé de remarquer que le vecteur e° est propre pour B, car 
B(e°) = Bf+!(x) = o. 


DÉFINITION. Supposons que des vecteurs quelconques e}, ., e" et le vec- 
teur propre e° satisfont aux conditions 


B(e!) = e9, B(e?) = e!,...,B(e*) = e-1. (7) 


On dit alors qu'ils sont respectivement les premier, deuxième, etc. vecteurs 
associés à e°. On dit aussi que e°, e!, …, e* constituent une chaîne de Jor- 
dan d’origine e°. 

On constate facilement que toute base cyclique se compose d’un vecteur 
propre et de vecteurs qui lui sont associés. Inversement, chaque chaîne de 
Jordan constitue une base cyclique dont on se convainc facilement en por- 
tant les égalitées (7) l’une dans l’autre. 


PROPOSITION 4. Le vecteur e° possède exactement h vecteurs associés 
(c'est-à-dire est l’origine de la chaîne de h + 1 vecteurs) si et seulement si 


etelmB"NKkKerB, etégéImB'*!. 


En effet, comme il a été noté à la p. 329, l’appartenance e° e KerB est 
équivalente à l’assertion que le vecteur e° est propre. Si e° e Im B”, il existe 
un vecteur x tel que e® = B#(x). La base cyclique engendrée par le vecteur 
x nous fournit la chaîne recherchée. La condition e° é Im B**+! signifie 
qu’il n’existe pas de chaîne plus longue qui commence par et. 

L’assertion inverse se démontre de façon analogue. 

3. Recherche de l’origine de la chaîne de vecteurs. Il ressort de la propo- 
sition 4 que les sous-espaces Im B* N KerB pour différents À doivent jouer 
un rôle important dans la construction des chaïnes. On désignera 
Im B! N KerB par #'. 

Le vecteur B/+!(x) pouvant être représenté sous la forme de 
B*(B(x)), on a les inclusions suivantes : 


ImBf-! CImBf-2c ….cImB'cImB. (8) 


6 2] FORME NORMALE DE JORDAN 335 


Si £ est l’indice de nilpotence, on a ImBf-! C KerB, c'est-à-dire que 
#1 = ]m Bf-!. Les intersections des sous-espaces de (8) avec le sous- 
espace KerB sont assurément incluses l’une dans l’autre de façon identique 
que les sous-espaces mêmes. Donc, 


ImBt-1 = æk-1çc æk-1C .. cc AIC PC KerB. (9) 


Choisissons dans l’espace des vecteurs propres Ker B une base liée aux 
espaces de (9). En premier lieu, rapportons à cette base tous les vecteurs 
d’une base quelconque de ##-!. Ensuite, joignons des vecteurs de æK-2 
qui sont linéairement indépendants des précédents, puis des vecteurs de 
RX—3, etc. Le vecteur d’un espace ##-! ne peut être inclus dans la base 
que si dans #* il n’y a aucun vecteur qui ne se décompose en une combi- 
naison linéaire des vecteurs déjà adjoints à la base. Ainsi, pour tout h, cha- 
que vecteur de ## se décompose suivant les vecteurs de la base dans æ#. 

Le processus décrit de l’adjonction de vecteurs s’achèvera quand la base 
dans KerB sera construite. Parmi les derniers vecteurs qui seront inclus 
dans la base de KerB, on pourra aussi trouver ceux qui n’appartiennent pas 
à Im B. On désignera la base ainsi construite par e° = Île®, …, el. 

4. Décomposition d’un sous-espace de racines en une somme de sous- 
espaces cycliques. Si à chaque vecteur de la base e, on adjoint une chaîne de 
vecteurs qui lui sont associés, on obtient le système suivant de vecteurs dans 
l’espace #_: 


6), 6); en, 
0 h: 
e ’ e;, , e:, 
: (10) 
Soon senees de 
e e . eh. 


PROPOSITION S. Le système de vecteurs propres et de vecteurs qui leur 
sont associés est libre si les vecteurs propres qui y appartiennent sont linéai- 
rement indépendants. 

Démontrons-le par récurrence sur le nombre de vecteurs dans le 
système. S’il n’y a qu’un seul vecteur, ce dernier est propre et l’assertion est 
évidente. 

Supposons que l’assertion est vérifiée pour tous systèmes de la forme 
(10) comprenant au plus N — 1 vecteurs. Pour un système de la forme (10) 
qui contient N vecteurs, considérons une combinaison linéaire quelconque 
égale à zéro : 


(11) 
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Démontrons que cette combinaison linéaire est triviale. Appliquons la 
transformation B aux deux membres de l’égalité (11). Il vient, compte tenu 
de (7), 


œle0 + … + oeil + 
1 00 heh2-1 
+ aheS + … + aftel2-1l + 


On a donc obtenu l'égalité à zéro de la combinaison linéaire de vecteurs 
d’un système de la forme (10), ayant un nombre de vecteurs strictement 
inférieur à N (la longueur de chaque chaîne a diminue de 1). Donc, tous les 
coefficients de la dernière combinaison linéaire sont nuls. Ceci pris en 
compte dans l’égalité (11), on aboutit à l’expression suivante : 


0 0 — 
me) + … + ae, = 0. 


Puisque les vecteurs propres sont linéairement indépendants, ces coeffi- 
cients sont également nuls. La proposition est démontrée. 


PROPOSITION 6. Tout vecteur de l'espace .#est une combinaison linéaire 
des vecteurs du système (10). 


Pour faciliter la démonstration on dira que le vecteur x de .#est de hau- 
teur h si x e Ker B*. Chaque vecteur non nul présente une certaine hauteur 
h,1<h< Kk, vu que B est nilpotent avec indice de nilpotence k&. On 
démontrera la proposition par récurrence sur la hauteur du vecteur. 

Un vecteur non nul de hauteur 1 est propre et, par construction du 
système e°, se décompose suivant les vecteurs e°, …, e°. 

Supposons que l’assertion est vérifiée pour les vecteurs de hauteur A et 
démontrons-la pour un vecteur arbitraire x de hauteur h + 1. A cet effet, 
considérons le vecteur x, = B"(x). Il est évident que x, e KerB, car 
B(B#(x)) = o. Donc, x,e #* = ImB’ N KerB. 

Le système de vecteurs e° est construit de manière que chaque vecteur 
de ## se décompose suivant des vecteurs de ce système qui appartiennent à 
Ph. Aussi dans le système e° existe-t-il des vecteurs er …, € de #7 tels 
que ; 

Xo = Een, +. + Een 


Or les vecteurs de .#* possèdent des vecteurs H-ièmes associés pour lesquels 
e9 = B'(e* ),...,e° = B'(e ). Ainsi donc,ona 
œ] æœ] Qg &o 


BA(x) = &, B'(eh) + …. + E, BA(eh ). 


On peut en conclure que le vecteur y = x — £E ef — ... —E£ el se 
a o 


œp. 4] 


trouve dans Ker B’, c’est-à-dire possède la hauteur h et vérifie l’hypothèse 
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de récurrence. Aussi se décompose-t-il suivant les vecteurs du système (10). 
Il en découle que x se décompose aussi suivant les vecteurs de ce système. 
Les propositions 5 et 6 montrent qu’on a construit dans l’espace une 
base qui est la réunion de bases cycliques. Cette base est appelée base de 
Jordan de la transformation nilpotente B dans l’espace .#. 
Etant donné que l’enveloppe linéaire de chaque chaîne de vecteurs est 
un espace cyclique, on obtient le théorème suivant. 


THÉORÈME 3. Un espace .# dans lequel est définie la transformation"nil- 
potente B se décompose en une somme directe de sous-espaces cycliques 
relativement à B. 

S. Dimensions des sous-espaces cycliques dans la somme directe. La 
décomposition obtenue en vertu du théorème 3 est loin d’être unique. Mais 
le nombre de termes de la somme directe et leurs dimensions sont définis de 
façon univoque. Commençons la démonstration de ce fait par la proposi- 
tion simple suivante. 


PROPOSITION 7. Si un espace .# se décompose de deux manières en 
somme directe de sous-espaces cycliques, le nombre de termes non nuls est 
le même dans les deux décompositions. 

En effet, soit 


1 ® 0 = À ©... (12) 


La somme des dimensions des sous-espaces dans le premier et le second 
membre de l’égalité est égale à la dimension de .#': 


S 4 = yl=m. 
tu! 


j=1 


Considérons les images par la transformation B des deux décompositions. 
On obtient deux décompositions de l’espace B (7) : 


B(%,) © … © B(%,) = B(%,) © … © B(Z,). (13) 


La somme y sera directe, car les sous-espaces cycliques sont invariants et 
tout vecteur de l’intersection de leurs images doit se trouver dans leur inter- 
section, c’est-à-dire être nul. 

Pour la décomposition (13), le calcul des dimensions selon la proposi- 
tion 11 du $ 1 fournit (h, — 1) + ... + (A, =Al)= (= DE 
— l)oum — p = m — o, d’où o = p. 


THÉORÈME 4. Supposons qu'un espace .* admet deux décompositions 
(12) en somme directe de sous-espaces cycliques par rapport à la transfor- 
mation nilpotente B. Dans ce cas, si l’une des décompositions comprend t 
termes de dimension h, la deuxième comprend aussi t termes de dimension h. 
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DÉMONSTRATION. Soit h, la plus petite des dimensions de sous-espaces 
cycliques rencontrées dans l’une des décompositions (12). Posons pour 
fixer les idées qu’exactement /, espaces de cette dimension figurent dans la 
décomposition du premier membre. Appliquons à deux membres de l’éga- 
lité (12) la transformation B#1. On obtient deux décompositions de l’espace 
B'1(.7) en somme directe d’espaces cycliques : 


BM(7,) © … © B(7,) = B(%) © … © B"(Z,). 


Dans le premier membre de l'égalité, il reste p — ft, termes non nuls. Un 
même nombre doit en rester dans le second membre. Il y avait donc exacte- 
ment /, espaces de dimension h, dans le second membre de la décomposi- 
tion initiale. 

Admettons ensuite que le théorème est démontré pour les dimensions ne 
dépassant pas À — 1 et que la décomposition du premier membre com- 
prend ! sous-espaces de dimension À. Appliquons aux deux membres de 
l'égalité (12) la transformation B*. Elle rendra nul, dans les deux membres, 
tous les termes dont les dimensions sont <h. Vu que dans l’égalité obtenue 
les deux membres ont le même nombre de termes, le nombre total d'espaces 
de dimension < A est le même dans les deux décompositions (12). En vertu 
de l'hypothèse de récurrence, cela signifie que le second membre de l’éga- 
lité (12) comprend exactement / sous-espaces de dimension 4. 

6. Matrice de la transformation nilpotente dans la base de Jordan. Con- 
sidérons d’abord la restriction de la transformation nilpotente B à un sous- 
espace cyclique ‘de dimension h. Si pour base dans Yon a choisi la chaîne 
des vecteurs e°, .…, e*-!, alors en vertu des relations (7), la matrice de la 
restriction de B à ; est de la forme 


O0 1 O0 … O0 
0 O I 0 
JO) = es : (14) 
0 O0 O ] 
0 0 0 .… oO 


car les colonnes de la matrice d’une transformation sont des colonnes de 
coordonnées des images des vecteurs de base. 

Soit maintenant un espace .# rapporté à la base (10). Etant donné que 
chaque chaïne qui la compose engendre un sous-espace invariant, la 
matrice de la transformation B par rapport à cette base se décompose en 
blocs diagonaux diag (J,(0), …, J (O)), où J (0) est une matrice carrée (14) 
d'ordre À, (v = 1,.…., p). 

7. Théorème de Jordan. Passons maintenant de l’étude d’un seul sous- 
espace de racines à celle de tout l’espace _Z . À chaque sous-espaces de raci- 
nes .# correspond une racine du polynôme minimal X. et une transforma- 
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tion B,;, restriction de la transformation À — À.E à ce sous-espace de raci- 
nes. 


DÉFINITION. On appelle base de Jordan de la transformation A dans 
l’espace / la réunion des bases de Jordan des sous-espaces de racines, 
construites pour les transformations B, de ces sous-espaces. 

Cherchons la matrice de la transformation À par rapport à base de Jor- 
dan. Commençons par la matrice À 9 de la restriction de À à un sous-espace 
cyclique quelconque %. Notons au préalable qu’on a toutes les raisons de 
parler de cette restriction car un sous-espace cyclique invariant par la trans- 
formation B, l’est aussi par À. 

En vertu de la définition de la transformation B,, sa matrice est 
À; — À;E, où E est la matrice unité d'ordre h égal à la dimension de 7. Or 
la matrice de la transformation B. est, comme on l’a montré, de la forme 
(14). Donc 


NO 1 O0 … 0 
0 À 1 … O0 
A JON NEÉ ES) eu 
buse \ | 
D À 


Cette matrice sera notée J(X,). On l’appellera bloc de Jordan d'ordre h à 
valeur propre X.. 

Il est en fait facile de noter que la matrice J(X,) possède l’unique nom- 
bre caractéristique À. De plus, le vecteur commençant la chaîne qui engen- 
dre le sous-espace :/ est le vecteur propre de la restriction de À à X et, par 
suite, de la transformation À. Cela découle directement de la forme que 
possède la première colonne de J(X,). 

Chaque espace de racines est une somme directe de sous-espaces cycli- 
ques. Aussi pour la matrice À, de la restriction de À au sous-espace .# 
a-t-On 


A, = diag (Ji (À), .. J, Qi). (15) 
Les ordres des blocs sont égaux aux dimensions des sous-espaces cycliques 
dont la somme directe est .#. 


La matrice À de la transformation À par rapport à la réunion des bases 
des sous-espaces de racines est égale, comme on l’a vu, à 


diag (4,, ..., À). 
On peut y porter les expressions (15) pour chaque matrice À, : 
A = diag (J!(À,), . J7 À). (16) 


Ce résultat peut être présenté sous forme de la 


os) ! 
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PROPOSITION 8. La matrice de la transformation À rapportée à sa base de 
Jordan est une matrice diagonale par blocs. Ses blocs diagonaux sont les 
blocs de Jordan dont les ordres sont égaux aux dimensions des sous-espaces 
cycliques en lesquels se décomposent tous les sous-espaces de racines, et 
dont les valeurs propres sont égales aux racines correspondantes du poly- 
nôme minimal de la transformation À. 


DÉFINITION. La matrice de la forme (16) décrite dans la proposition 8 
sera appellée matrice de Jordan. Si la matrice d’une transformation linéaire 
est rapportée à sa base de Jordan, on dit qu’elle est réduite à la forme nor- 
male de Jordan. 

Il importe de noter que pour obtenir la forme normale de Jordan de la 
matrice d’une transformation il suffit de connaître les racines du polynôme 
caractéristique avec leurs multiplicitées, ainsi que les dimensions des sous- 
espaces cycliques. Le polynôme caractéristique est invariant. Quant aux 
dimensions des sous-espaces cycliques, elles sont définies de façon univo- 
que en vertu du théorème 4. On aboutit au théorème suivant dénommé 
théorème de Jordan. 


THEORÈME S. Pour toute transformation À de l'espace vectoriel com- 
plexe 7, il existe une base par rapport à laquelle sa matrice présente une 
forme normale de Jordan. Ceci étant, la forme normale de Jordan de la 
matrice est définie par la transformation de façon univoque à l'ordre des 
blocs diagonaux près. 

8. Remarques et corollaires. Comme tous les théorèmes sur les transfor- 
mations linéaires, le théorème de Jordan peut être. formulé en termes de 
matrices. Les matrices À et À ‘ sont dites semblables s’il existe une matrice 
régulière S telle que À ° = S-!AS. 


THEORÈME 5M. Toute matrice est semblable à une matrice de Jordan. 
Pour que les matrices À et À” soient semblables il faut et il suffit que les 
matrices de Jordan correspondantes soient égales à l’ordre des blocs diago- 
naux prés. 

La nécessité de la condition est évidente car deux matrices semblables 
peuvent être interprétées comme des matrices d’une même transformation 
linéaire par rapport aux bases différentes. Pour démontrer la suffisance, 
remarquons que les matrices J et J'” qui se distinguent par l’ordre des blocs 
diagonaux sont semblables. En effet, la matrice correspondante S est la 
matrice du changement de base se réduisant à la permutation des vecteurs 
de base. Aussi a-t-on À = P-1JP, A° = Q-lJ'Qe J' = S-1JS, d’où 
A° = Q-'S-'PAP-ISQ. 

La forme normale de Jordan n’est pas l’unique forme normale à 
laquelle on peut réduire la matrice d’une transformation linéaire. Dans la 
httérature spéciale (voir, par exemple, Maltsev [26]) le lecteur trouvera 
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d’autres formes normales de la matrice d’une transformation linéaire, en 
particulier la forme normale à laquelle se réduit la matrice de toute trans- 
formation linéaire dans l’espace vectoriel réel. 

Il découle de la formule (9) que la longueur maximale de la chaîne dans 
un espace de racines .# est égale à l’indice de nilpotence de la transforma- 
tion correspondante B,, qui coïncide avec la multiplicité de la racine X, du 
polynôme minimal. D'où la proposition suivante. 


PROPOSITION 9. L'ordre maximal du bloc à valeur propre X. est égal à la 
multiplicité de la racine X, du polynôme minimal. 


On sait bien que toute transformation linéaire n’admet pas de base dans 
laquelle sa matrice est de forme diagonale. Le théorème de Jordan nous 
indique la forme la plus simple à laquelle se réduit la matrice de chaque 
transformation linéaire dans un espace complexe. Elle diffère de la forme 
diagonale par le fait qu’elle contient des unités situées immédiatement 
au-dessus de la diagonale principale. La matrice diagonale est un cas parti- 
culier de la matrice de Jordan. 


DÉFINITION. On dira qu’une transformation linéaire est de structure sim- 
ple (ou à spectre simple) si son polynôme minimal n’a pas de racines mul- 
tiples. 

La proposition 9 entraîne la proposition suivante. 


PROPOSITION 10. La transformation linéaire possède dans une certaine 
base une matrice diagonale si et seulement si cette transformation est de 
Structure simple. 

A propos de cette assertion il convient de se rappeler l’exemple de la 
p. 329. 

La matrice de Jordan peut être représentée sous forme de la somme 
d’une matrice diagonale et d’une matrice diagonale par blocs 


B = diag (J!(0), …, JF (O)). 


Démontrons que B° = Osirest l’ordre maximal du bloc. En effet, la puis- 
sance r-ième de toute matrice diagonale par blocs diag (C;, ..…., C.) est la 
matrice diag (C", ..…, C7). On peut s’en assurer d’après la définition du 
produit des matrices. Les blocs diagonaux sont des matrices de transforma- 
tions nilpotentes, de sorte que toutes leurs puissances n7-ièmes s’annulent si 
nest supérieur ou égal à leur ordre. Ainsi, la matrice B est une matrice de la 
transformation nilpotente. 


PROPOSITION 11. Toute transformation linéaire d'un espace vectoriel 
complexe peut être représentée sous forme de la somme d'une transforma- 
tion de structure simple et d’une transformation nilpotente, qui commutent 
entre elles. 
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L’existence d’une telle représentation découle directement des raisonne- 
ments précédents. Pour démontrer la commutativité, remarquons que la 
matrice diagonale dont il s’agit plus haut peut être assimilée à une matrice 
diagonale par blocs. Ceci étant, chacun de ses blocs ne diffère de la matrice 
unité de même ordre que par un facteur et, par suite, commute avec le bloc 
correspondant de la matrice nilpotente. 

9. Construction d’une base de Jordan. La démonstration donnée du 
théorème de Jordan est constructive, c’est-à-dire renferme un procédé de 
construction de la base de Jordan. Néanmoins, on a toutes les raisons de 
s’arrêter encore une fois sur les opérations qu’on doit accomplir pour cons- 
truire la base de Jordan d’une transformation linéaire définie dans une 
base par la matrice 4. Ce faisant, on négligera le côté du problème se rap- 
portant aux calculs. 

En particulier, on supposera qu’on est en mesure de calculer les racines 
du polynôme caractéristique de la matrice À et leurs multiplicités. C’est 
justement à partir de cela que doit débuter la construction de la base de 
Jordan. La suite d'opérations décrite ci-dessous doit être appliquée à cha- 
cune des racines du polynôme caractéristique. 

Pour la racine À* on considère la matrice 4 — N*E. Si Rg (A — 
— À*E) > n — m, où m est la multiplicité de la racine X*, on calcule le 
carré, le cube, etc. de la matrice À — X*E, tant qu’on n’obtienne la puis- 
sance £-ième pour laquelle Rg (4 — À*E)* = n — m. Le nombre & est la 
multiplicité de la racine À* du polynôme minimal. (Si Rg(A — À*E) = 
= n — m, la racine du polynôme minimal est simple.) En effet, si la 
matrice À est de la forme de Jordan, les seuls blocs nilpotents dans la 
matrice À — À*E sont les blocs correspondant à la racine À*. Les autres 
blocs sont des matrices régulières. Dans la matrice (4 — X"*E)£, les blocs 
correspondant à À* s’annulent et le rang de (À — X*E){ devient égal à n — 
— m. Vu que le rang de cette matrice est indépendant du choix de la base, 
la condition imposée sur le rang de (A4 — À*E)f est la même dans toute 
base. 

Considérons les colonnes qui renferment le mineur principal de la 
matrice (4 — À*E){-!. Leur enveloppe linéaire est Im(A — À\*E){-!. On 
ne connaît pas le sous-espace de racines mais on peut obtenir le sous-espace 
ÆK1\ (voir formule (9)) si l’on trouve l’intersection de Im(A — \*E){-! 
avec le sous-espace ./"(X*) des vecteurs propres associés à la racine À*. 
Considérons un système maximal de vecteurs linéairement indépendants 
dans .:#*#-!, Ce sont les vecteurs propres qui commencent les chaînes de 
longueur maximale £. Si le nombre total de vecteurs dans ces chaïnes est 
strictement inférieur à m, on considère l’intersection «##-2. Im(A — 
— À'E){-i N S(X*). Complétons les vecteurs propres déjà choisis jusqu’à 
la base dans :#“-°. Les vecteurs propres ajoutés sont les origines des 
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chaînes de longueur £ — 1. Si la longueur totale de toutes les chaînes est 
encore strictement inférieure à m, on continue la recherche de nouveaux 
vecteurs propres dans les espaces .#*-3, ..., jusqu’à ce que la longueur 
totale de toutes les chaînes soit égale à m. 

Il n’est pas nécessaire de trouver tous les vecteurs pour calculer la lon- 
gueur de la chaîne, mais on pourra les obtenir dès qu’on aura choisi un vec- 
teur propre e° qui commence la chaîne. Les vecteurs e!, ..., e* associés à e0 
s’obtiennent par résolution des systèmes linéaires par rapport aux colonnes 
de coordonnées de ces vecteurs : 


(A — \*E)e!' = el, [= 1,...,h, 


dont le premier système contient le vecteur propre e°. Il convient de souli- 
gner que pour les résoudre il suffit de trouver une seule solution de chaque 
système. 

Il y a exactement À systèmes de cette forme qui sont compatibles si 
e  eft-leete.#'. 

On a décrit ici la construction des vecteurs de base de Jordan dans un 
sous-espace de racines. La reunion de toutes ces bases donne une base de 
Jordan dans ”. 

La matrice de Jordan d’une transformation peut être écrite aussitôt que 
sont connues les longueurs de toutes les chaînes correspondant à chaque 
racine du polynôme caractéristique. 


$ 3. Fonctions de matrices 


1. Introduction. En accord avec la définition générale de la fonction, on 
appelle fonction définie sur un ensemble ./’de matrices carrées d’ordre n à 
valeurs dans un ensemble .*l’application qui à chaque matrice de l’ensem- 
ble . associe un élément unique de l’ensemble .*. En particulier, on s’inté- 
ressera aux fonctions dont les valeurs sont aussi des matrices carrées de 
même ordre. Toutefois, sans restrictions supplémentaires, on n’arrive pas à 
saisir dans une définition aussi large que 7? nombres composant la matrice 
sont ordonnés de façon spéciale et que les opérations algébriques sont défi- 
nies sur les matrices. Au fond, on pourra dire autant de cette fonction que 
de tout #72-uple de fonctions de #2? variables. 

On fournira une définition plus restrictive, permettant de tenir compte 
de la spécificité de l’argument matriciel. Cela permet de définir pour des 
matrices les fonctions élémentaires telles que les fonctions exponentielle, 
puissance, logarithmique, trigonométrique, etc. Un exemple de ce genre a 
déjà été rencontré. En se servant des opérations algébriques sur les matri- 
ces, on a porté une matrice dans le polynôme comme valeur de la variable 
indépendante. La matrice obtenue était prise pour la valeur du polynôme 
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sur la matrice initiale. Chacune des fonctions élémentaires mentionnées 
plus haut se décompose dans un certain domaine en une série entière. En 
ajoutant aux opérations algébriques sur les matrices l’opération de passage 
à la limite, on peut définir la somme de la série entière matricielle. Les 
fonctions qui se laissent développées en séries entières de matrices feront 
justement l’objet de notre étude. 

Pour assimiler ce paragraphe, le lecteur a besoin de savoir les faits ele- 
mentaires sur les séries entières d’une variable complexe. 

2. Fonctions régulières de matrices. Soient données une suite numérique 
complexe fa, | et une matrice carrée À. La somme formelle 


GE + œ A + a A? + … 


ou bien 


y a, AK (1) 
kK=0 
est appelée série entière par rapport à la matrice À. Les sommes finies de la 
forme 


N 


D) œ, A* 


k=0 


sont appelées sommes partielles de la série (1). 

Choisissons dans l’espace des matrices carrées d’ordre nr une norme 
matricielle, par exemple 

LAN = n max la. (2) 

La série (1) est dite convergente vers la matrice F si la suite des sommes 
partielles de cette série converge en norme choisie vers F, c’est-à-dire que 
pour tout nombre € > Oil existe un N,(e) tel que pour tous les N > N,(E) 
est vérifiée l’inégalité 


< €: 


N 
| r — D) a, A* 
k=0 


Si la série (1) converge vers la matrice F, on dira que F est la somme de la 
série et On écrira 


La définition de la somme d’une série entière s’étend facilement aux 
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ÿ a,(A — A5)*, 


K=0 


séries de la forme 


où À, est une matrice fixée. Grâce à la facilité de passage des séries de cette 
forme aux séries de la forme (1) et inversement, on étudiera essentiellement 
les séries de la forme (1). 

On a démontré au $ 3 du ch. XI que la convergence d’une suite de 
matrices en norme quelconque est équivalente à la convergence en élé- 
ments. Aussi peut-on considérer une série entière matricielle comme n° 
séries numériques. 

Chaque somme partielle est une matrice qui est égale à la valeur du 
polynôme à coefficients @,, .…, a, sur la matrice À. Il va de soi que la 
somme de la série, si cette série est convergente, dépend aussi de À. 


DÉFINITION. Soient ef ‘# deux ensembles de matrices carrées com- 
plexes d’ordre n. La fonction sur l’ensemble ./ à valeurs dans l’ensemble 
S est dite régulière s’il existe une série entière convergeant sur . telle que 
pour chacune des matrices À de _/’est vérifié 


SCA) = Ÿ ax(A — Ag). 


k=0O 


Une propriété importante des fonctions régulières de matrices est expri- 
mée par la proposition suivante. 


PROPOSITION 1. Soit : 
f(A) = y a, A. 
k&=0 


Dans ce cas, pour toute matrice régulière S on a l'égalité 
S-1f(4)S = Ÿ a,(S-! AS). 
k=0 
DÉMONSTRATION. (S-! AS} = S-1ASS-1AS = S-14?S. On vérifie 
aisément par récurrence que pour tout £ona(S-!A48S)f = S-1A4£%S. D'où 


on obtient pour les sommes partielles de la série 
N 


s-1(Y a,At)S = D a,(S-'ASY. 
kKs=0 


k=O 


La proposition sera démontrée si on démontre que pour tout facteur à 
droite constant on a lim (P,,.S) = Clim P,)S, et qu’on démontre l'égalité 
N—œ —® 


analogue pour tout facteur à gauche. 
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La démonstration de ces égalités est absolument analogue à la démons- 
tration connue de l’analyse. Soit lim P,, = F. Majorons la norme de la 
N—œ 


différence P,,S — FS : 
UP,S — FSI < IP, — FA: ASH. 


On voit que cette norme sera inférieure à € pour AP, — FA < e° = e/I SI. 
Or on a par définition IP,, — FÎ < €” pour tous les N > N,(e'). Pour les 
facteurs à gauche la démonstration est presque la même. 

Considérons un espace vectoriel , rapporté à une base e. Soit A une 
transformation linéaire de l’espace 7 définie par la matrice À dans la base 
donnée. Si À ‘ est la matrice de À par rapport à la base e” = eS, il ressort 
de la proposition 1 que f(4 ‘") = S-!f(A)S. Donc, les matrices / (A ‘) et 
J(A) définissent une même transformation linéaire quelle que soit la base 
e . On peut interprêter la transformation de matrice f(4) comme une 
valeur de la fonction f sur la transformation À et la noter f (A). 

3. Etude de la convergence des séries entières matricielles. Dans l’étude 
des séries entières de matrices, la proposition 1 nous offre la possibilité de 
les simplifier par substitution de la matrice S -! 4S à l’argument matriciel 
A. 


PROPOSITION 2. Soit À = diag (A,,..…., À). Alors pour toute fonction 
régulière f définie sur la matrice À, 


S(A) = diag (A), …, S(A,). 


En effet, comme il a été montré à la p. 341, toute puissance de la 
matrice diagonale par blocs est une matrice de même type qui contient les 
puissances des blocs diagonaux. Vu que l’addition et la multiplication par 
un nombre sont définies pour les matrices comme opérations sur leurs élé- 
ments, On a pour tout polynôme p 


p(A) = diag (p(A,), .…, p(A,)). 


Ensuite, puisque la norme (2) de la matrice est supérieure à celle de l’un 
quelconque de ses blocs, les inégalités 


Ip, (4,) — SCA; < € 
se vérifient à partir au moins du même numéro que l’inégalité 
lp, (4) Fi SCA) < €, 


ce qui achève la démonstration de la proposition. 

Etant donné une matrice carrée À d’ordre ñn, on peut lui faire corres- 
pondre une transformation linéaire À définie par la matrice À dans une 
base e. Soit maintenant S la matrice de passage de la base e à la base qui est 
la réunion de bases des sous-espaces de racines de la transformation À. 
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Alors, comme on sait, 
A° = S-'AS= diag (A,, …, À), 


où À,, …, À, sont les matrices des restrictions de À aux sous-espaces de 
racines. En vertu de la proposition 2, on obtient maintenant 


SCA) = Sf(A')S71 = S diag ((A,), .…,f(A,)S"!. (3) 
Ce résultat peut être formulé ainsi : 


PROPOSITION 3. La fonction régulière f est définie sur la matrice À de la 
transformation linéaire À si et seulement si elle définie sur les matrices À; 
des restrictions de À à ses sous-espaces de racines. La valeur f(A ) peut être 
obtenue par la formule (3). 


Considérons maintenant un sous-espace de racines .# de dimension m,, 
correspondant à la racine X,. On a vu que la transformation linéaire B,, qui 
est la restriction de la transformation À — ÀE à .#, est nilpotente et son 
indice de nilpotence £: est égal à la multiplicité de la racine x, du polynôme 
minimal. La transformation B; est définie par la matrice B, = 4, — À,E,,, 


où E,, est la matrice unité d’ordre m,. Ainsi, la matrice À, peut être repré- 
! 
sentée sous forme de la somme 


A, = B, + KE. 


La matrice E,, commute avec B; comme avec toute autre matrice de même 
î 


ordre. Aussi la puissance r-ième de la matrice À peut-elle être écrite suivant 
la formule du binôme de Newton. (Rappelons que pour des matrices com- 
mutables, les règles d’opérations sur les polynômes sont les mêmes que sur 
les nombres.) Si C’ sont des coefficients binomiaux, on a 


Af = (B,+ XE,) = Ÿ CiBiN i. 
j=0 


En vertu de la nilpotence de la matrice B, les seuls termes non nuls de cette 
décomposition sont les termes de degré j < k;. Pourr 2 k:ona 


ki- | 
Aï= Y CiNTIBI. 


j-0 


Etablissons les conditions sous lesquelles la série 


ÿ a, A; (4) 


r=0 


est convergente. Toute somme partielle de cette série ne contient aucune 
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puissance de B; dont l’exposant est strictement supérieur à &, — 1. On peut 
réunir les termes qui contiennent une même puissance de B, en k; groupes : 


N k;-1 
Y'aA; = Ÿ viB!, 
r=0 j=0 
où 
N 


= Ÿ a,CiNTi. 
re) 
En se rappelant l'expression du coefficient binomial C’, on trouve 
N 


vN = ñ L arr — 1)... (r — j + DXTZ. 


Considérons maintenant la série entière scalaire d’une variable complexe : 


JE) = ÿ ar. (5) 


r=0 


Admettons que le point À; se trouve à l’intérieur du disque de convergence 
de cette série. Alors comme on le sait, on peut dériver la série terme à terme 
au point À, autant de fois que l’on veut. La dérivée d’ordre j de la fonction 
JE) au point À, prend la forme 


- JR) = Lar(r- 1)... (r- j + DNA. 


dt | 


Le nombre uv" ÿ ne diffère que par un facteur de la somme partielle d’ordre 
N de la série de fU)(X.). Donc, 


of + JU) pour N— oo. 


Il s'ensuit que 


N k,=1 kj—1 
| ls. 
Das Don ivma 0 
rs0 J=0 j=0 
En effet, si on pese _ + JU) par v,, on obtient 
k;-1 k;-1 
DuB- ju < Llu- vis < 
j=0 j-0 j 


U 
J 
| . 
< maxi El ul 
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Mais pour chacune des k; suites [uY ] il existe pour tout €’ > Oun N(E°) à 
partir duquel on a lu" — vu. < €’. Pour que le dernier membre de l’inéga- 
lité (7) soit inférieur à € il suffit que soit vérifiée l’inégalité N > 
> max NE"), oùe’ = e/(max I B/l-k:). 
J J 
En définitive, on a 


œ k,-1 


Das Vos 
J=0 


r=0 


ou, en substituant 4, — À:E à B,, 
kj—1 


f{A,) = > 7/0 XA — XEŸ. 
j=0 


La relation (6) montre que pour la convergence de la série (4) il suffit que le 
nombre X, se trouve à l’intérieur du disque de convergence de la série (5). 
Mais si À, se trouve à l'extérieur du disque de convergence, même la suite 
[u” ] n’a pas de limite. Aussi pour la convergence de la série (4) faut-il que 
À, se trouve à l’intérieur du disque de convergence ou sur sa frontière. 
Profitons de la proposition 3 et de la formule (3) pour passer de la 
matrice 4, à la matrice de départ 4. On aboutira alors au théorème suivant. 


THÉORÈME 1. Pour qu'une fonction régulière f définie par la série (5) 
soit définie sur la matrice À il suffit que les racines du polynôme caractéris- 
tique de la matrice À se trouvent à l’intérieur du disque de convergence de 
la série (5). Pour que la condition soit nécessaire il faut que ces racines 
appartiennent à la fermeture du disque de convergence. Dans ce cas, siS est 
la matrice de passage à la base située dans les sous-espaces de racines de la 
transformation associée à À et 


A = Sdiag (A,,.…., 4.)S71, 
on a 
ki! 
Ë | ee 
f(A) = S diag > = SORA, — À EY, … 
j=0 ci 
ko! 
1, =: | 
…. 3 A/VANA, — NEY (ST. (8) 
jo 
ExEMPLE |. Appliquons la formule (8) à une matrice de structure sim- 
ple. Dans ce cas, les multiplicités £; des racines du polynôme minimal sont 
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égales à l’unité et dans la formule (6) il ne reste que les termes avec 
B=E, : 
i 


N 
Y a,A' = S a, NE, — SN)Em; 


r=0 r=0 
Ensuite, d’après la formule (3), on obtient 
J(A) = S diag WADE,» 1 JADE, ST. 


Dans le cas particulier où À est une matrice diagonale, f (A) est aussi une 
matrice diagonale obtenue de À par substitution du nombre f(X,) à chaque 
élément x, de la diagonale. Dans le cas général, on utilise la matrice de pas- 
sage S à la forme diagonale. Soit par EE 

| 


DITS |- 
0 e? 1 —1 


EXEMPLE 2. Considérons la valeur de la fonction sur une matrice qui se 
compose d’un seul bloc de Jordan, par exemple d’ordre quatre : 


Ono 


À 1 O O 
O0 À 1 0 . 
A=!0o 0 x 1| 
: 0 O0 O À 
Pour À, les matrices B, B? et B? sont respectivement 
0 1 O0 O0 0 O0 1 0 0 O0 O0 1 
0 O0 1 O0 0 0 O 1! 0 O0 0 O0 
0 O0 O 1 0 O0 O0 ol 0 0 O0 0 
0 0 0 0 0 0 0 0 0 0 0 0 


(Ici il n’y a qu’un seul sous-espace de racines, de sorte que l’indice ;, qui a 
une seule valeur, est omis.) Par la formule (8) on obtient 


f(A) = fOE + f'OB + JS" OE? + HO = 


Pas 


fo SO 210 Lr-o 


Ù 
= ON 


0 fO FO fl 


0 0 JO JO 
0 0 0 JO 


D 
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Pour formuler encore un corollaire de la formule (8), introduisons la 
définition suivante 


DÉFINITION. On appelle valeurs de la fonction f sur le spectre de la 
matrice À les k, + .… + k, nombres 


SA SR), SU) (= 1,.,5), 


où À,, .…, À, sont les racines du polynôme minimal de la matrice 4 et 
K,, .…., &, leurs multiplicités. 


PROPOSITION 4. Si les racines du polynôme minimal de la matrice À se 
trouvent à l'intérieur du disque de convergence de la série scalaire qui défi- 
nit la fonction f, la valeur de la fonction f sur la matrice À est définie de 
façon univoque par les valeurs de f sur le spectre de À. 


La proposition découle immédiatement de la formule (8). Or cette for- 
mule exprime f(4) au moyen des valeurs de f sur le spectre de 4 d’une 
façon assez compliquée. Son application nous oblige de changer de base et 
de composer la matrice avec des blocs diagonaux. On montrera plus loin 
comment on peut éviter ces inconvénients. 

Le symbole diag (f(4,), ..…., f(4,)) peut être interprété comme une 
opération associant à l’ensemble des matrices f (A, ), ., f(A4,) une matrice 
à blocs diagonaux f(4,), ..., f(4,). Si l’on passe des matrices aux transfor- 
mations, l’opération diag se laisse interprétée de la façon suivante. 

Soit un espace décomposé en somme directe de sous-espaces Mise 
……, .#. Supposons qu'une transformation f(A.) est définie sur chaque .#.. 
On construit une transformation f (À) pour laquelle les .# sont des sous- 
espaces invariants et les (A) sont des restrictions à ces sous-espaces. 
Proposons-nous de réaliser cette construction indépendamment de la base. 
Ceci étant, les transformations f(A.) des sous-espaces .# seront définies 
non pas directement mais comme des restrictions de certaines transforma- 
tions F; définies sur tout l’espace. Soit donc 


ki 1 


F = . 3 JHANA = XEY. (9) 


J=0 


Cette transformation est un polynôme en À, de sorte que les sous-espaces 
#,, …, # SONt invariants par F.. Les restrictions de F; à .#, avec / # i, ne 
nous intéressent pas, quant à la restriction de F,; à .#, c’est j'(A.). 

Pour construire f(A) à partir des F;, il nous faut une plus ample infor- 
mation. 

4. Injection canonique et projecteur. Considérons un sous-espace 7” 
de l’espace vectoriel = Tout vecteur de /" appartient à Æ et l’on peut 
définir une application Î : /’” — _/qui à chaque vecteur x e /” associe le 


352 THÉORÈME DE JORDAN. FONCTIONS DE MATRICES [CH.XII 


même vecteur, considéré comme un vecteur de = Cette application est 
appelée injection canonique de / " dans 

Si une base e dans _/’est obtenue par adjonction de vecteurs à la base e’ 
de / ", la matrice de l’injection canonique par rapport aux bases e’ ete 
contient des colonnes de la matrice unité d’ordre n, dont les numéros sont 
ceux des vecteurs de la base e” qu’ils ont dans la base e. 

Admettons maintenant que l’espace est décomposé en somme directe 
de sous-espaces .#,, …, .#. Cela signifie que chaque vecteur x de se 
décompose de façon univoque en somme de la forme x = x, + .… + x,, 
où x; e .#: pour tous les i. Cette décomposition permet de définir pour cha- 
que sous-espace .# une application P, : /— .# telle que P,(x) = x.. 

L'application P. est appelée projecteur de “sur .#. Il faut toutefois se 
rappeler qu’elle est définie par toute la famille de sous-espaces #, .…, # 
et non pas par un seul .#. 

Si la base de est la réunion de bases des sous-espaces .#,, ..., L#, la 
matrice du projecteur P; se compose des lignes de la matrice unité d’ordre 
n, dont les numéros sont égaux aux numéros des vecteurs de base se trou- 
vant dans .#. 

Supposons maintenant que les sous-espaces _# sont invariants par une 
transformation F et notons C, les restrictions de F à .#. On a dans ce cas 
l’égalité 

C;P, = PF. (10) 

En effet, pour tout x de / on a 


ù F(x) = y F(x;) = D C;(x;), 


avec x;e .#' et C.(x;)e .#. Donc, P,F(x) = C;(x;). 

D'autre part, il est évident que C;P.(x) = C.(x;). La formule (10) est 
ainsi démontrée. 

5. Décomposition spectrale. Revenons au calcul de f (A). On est mainte- 
nant en mesure de montrer que 


J(A) = S LP:F,, (11) 
im] 


où P. est le projecteur sur le sous-espace de racines .#, |, l’injection canoni- 
que définie sur .#, et F; se définit par la formule (9). En effet, selon (10), il 
vient 


2 LP.F; = y L/(A,)P.. 
ic! im 


Considérons la transformation se trouvant dans le second membre de l'éga- 
lité, et déterminons sa matrice par rapport à la base qui est la réunion de 


bases des sous-espaces de racines. Il faut pour cela multiplier, pour chaque 
i, les matrices J., f(A,) et P. de types respectifs (7, m),(m,, m;)et (m,,n). 
Compte tenu de la forme des matrices J. et P. qui a êté indiquée au point 4, 
on trouve que Z.f(A,)P, est une matrice carrée d’ordre 7 dont un seul bloc 
sur la diagonale principale est différent de zéro. Ce bloc se dispose dans les 
colonnes qui correspondent aux vecteurs de base de .#' et vaut /(A,). Sché- 


matiquement cette multiplication peut être représentée ainsi : 


—w) 0, 
CL 


Ensuite, en additionnant les matrices obtenues, on trouve que la trans- 
formation 


Z WAP, 
im] 


se définit dans la base envisagée par la matrice diag (f(4,), ..., f(A,.)). 
Donc, elle est égale à f(A), ce qu’il fallait démontrer. 

En tenant compte de la formule (9) et en portant le produit l,P; sous le 
symbole de sommation, on La écrire (11) sous la forme 


fA) = > ÿ: = FÜALP.(A — XE. (12) 


> j=0 


Il découle de la formule (12) qu’on vient de démontrer que quelle que 
soit la base, on a 


s k;—1 
f(A) = }) Ÿ LP, 7/4 _ LE. (13) 
il j=0 


Pour rendre le résultat plus explicite, introduisons la 
DÉFINITION. Les matrices 
Z; = 1,P, —— — ÀEŸT", i=1,...,s, j = 1,...,Kk, (4 
G— CT: (A y! J » (4) 


sont appelées matrices composantes de la matrice À. En particulier, 
Z;, = Z,P.. 
Maintenant l’égalité (13) équivaut au théorème suivant. 


23—6442 
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THÉORÈME 2. La matrice f(A) est la combinaison linéaire suivante des 
matrices composantes : 


s K; 
J(A) — D) Y'JUNQR)Z;. (15) 


int jel 


L'égalité (15) est appelée décomposition spectrale de f(A). Notons les 
propriétés suivantes de cette décomposition. 

1. Les matrices Z. sont indépendantes de la fonction f, de sorte que 
pour des fonctions régulières différentes, les décompositions spectrales ne 
diffèrent que par les valeurs de la fonction sur le spectre de À. 

2. La matrice f(A) s'exprime linéairement par les valeurs de f sur le 
spectre de A. 

3. Pour toutes les fonctions dont les valeurs sur le spectre de À 
coïncident, la valeur de f(A ) est la même. 

La dernière propriété peut être utilisée pour réduire le calcul de f(A ) à 
celui d’un polynôme de À. 


PROPOSITION 5. Quels que soient la matrice À et les nombres B., i = 
= 1,...,5,7 = 1,...,K., il existe un polynôme et un seul dont le degré est 
strictement inférieur au degré k du polynôme minimal et dont les valeurs 
sur le spectre de la matrice À sont B;- 


DÉMONSTRATION. La valeur du polynôme en un point fixé est une fonc- 
tion linéaire de ses coefficients. Il en est de même des valeurs de ses dérivées 
de tous ordres. Par conséquent, l’exigence que le polynôme présente sur le 
spectre de la matrice À les valeurs mentionnées est équivalente à un système 
d'équations linéaires en ses coefficients. Si le degré du polynôme est 
<k — 1, le nombre d’inconnues dans le système est k. Le nombre des 
équations est égal à celui des valeurs sur le spectre, c’est-à-dire est aussi K. 
Il reste donc à démontrer que le déterminant de la matrice du système est 
différent de zéro. On le démontrera si on montre que le système homogène 
associé ne possède qu’une solution nulle. 

Démontrons la dernière assertion. Considérons pour cela le polynôme 
qui présente sur le spectre de À les valeurs nulles. Il découle de (15) que 
c’est un polynôme annulateur pour la matrice 4. Or son degré est stricte- 
ment inférieur à celui du polynôme minimal, et il doit être nul. La proposi- 
tion est démontrée. 

Le polynôme décrit dans la proposition S est appele polynôme d'’inter- 
polation de Lagrange. 

6. Propriétés des matrices composantes. Démontrons la proposition qui 
suit. 


PROPOSITION 6. Chaque matrice composante est un polynôme de À de 
degré strictement inférieur à celui du polynôme minimal. 
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” Considérons une matrice composante arbitraire Z;;. Soit h;, le poly- 
nôme de Lagrange pour lequel HŸ - D(XA) = 1, les autres valeur sur le 
spectre étant nulles. De la formule (15) il découle que h;,(A) = Z;; : 


PROPOSITION 7. Pour toute matrice À, les matrices composantes sont 
linéairement indépendantes. 

DÉMONSTRATION. Considérons une combinaison linéaire nulle des matri- 
ces composantes 


s 


k; 
L Luz = O 
il j=1 


C’est un polynôme de la matrice À, égal à zéro. Etant donné que son degré 
est strictement inférieur à celui du polynôme minimal, c’est un polynôme 
nul. Cela signifie que pour les polynômes h;; de la proposition 6 est vérifiée 
l'égalité 


S Luyhy = 0 (6) 


isl je 


Démontrons qu'il en résulte que à = 0 pour tous les ; et j. En portant 
dans l'identité (16) le nombre X,, i = 1, .…, s, on obtient que y,, = 0. 
Ensuite, dérivons cette identité et ve À, dans la dérivée du premier 
membre. On obtient y,, = 0. On continuera à dériver et de porter À, 
jusqu’à l’ordre K* = max &.. On obtiendra ainsi toutes les égalités exigées. 
Vu que les matrices composantes sont des polynômes de À, on a la 


PROPOSITION 8. Les matrices composantes de la matrice À commutent 
entre elles et avec la matrice À. 

Mentionnons quelques relations algébriques que vérifient les matrices 
composantes. D'abord, pour tous i = 1,...,s, les matrices Z;, sont idem- 
potentes. Cela signifie que 


Zi, = Zi 
pour tout exposant 7. La démonstration est immédiate. En effet, l’image 
d’un vecteur x par la transformation Z;, de matrice Z, = J;P; est un vec- 


teur obtenu par la projection de x sur .#, suivie de |” injection canonique 
dans / Il est évident qu’une succession de ces transformations ne fait pas 


varier le résultat. | 
En portant f(£) = 1 dans la décomposition (15), on vérifie que 


Etant donné que le facteur à droite dans l’expression l.B/-!P. = Z; est 
45 
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un projecteur, on a Im Z,, © .#et .#; © Ker Z;; pour ! # i. D’où 
Z;;Zm = O pour i + | ettous les j, m 


La transformation Z, agit sur .# comme une transformation identique, 
de sorte que pour tous les ji et j 


Notons encore une égalité intéressante qu’on obtient pour f(£) = £ 


- LA + Z;) 


111 


Il est instructif d’étudier les matrices composantes d’une matrice À pos- 
sédant la forme de Jordan. Au lieu d’une description générale encom- 
brante, on donnera un exemple suffisamment caractéristique. Dans les 
matrices d’ordre six écrites plus bas, les éléments qui manquent sont égaux 
à zéro. Soit 


2 
2 ! 
2 
A = 3 1 
3 1 
On a alors pour une fonction f 
JQ) 
JQ) f'Q 
f(2) 
(A) = JG) f'G) 37 6) 
JG)  f°() 


SG) 


En vertu de l’indépendance linéaire des matrices composantes, on obtient 
de (15) 


] 0 


0 | 
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0 0 
0 1 0 
0 0 
Aa 0 ua 0 1 ol” 
0 0 1 
0 0 
0 
0 
0 

oo o 0 

2 

0 0 

0 


7. Calcul des matrices composantes. On peut construire le polynôme 
d’interpolation de Lagrange en partant du problème d’interpolation d’Her- 
mite. Ce problème consiste à construire pour une fonction donnée f et pour 
s points différents À,, …, À, un polynôme qui, avec ses dérivées d’ordres 
mentionnés £,, .…, &., présente aux points À,, …, À, les mêmes valeurs que 
la fonction f. Ce polynôme de degré inférieur à K = k, + .. + K est 
aussi appele polynôme d'interpolation d’Hermite. 

Le polynôme d’Hermite peut être obtenu d’après la formule 

s k, 
HE) = ŸY YU )h,E), 


int joel 


si sont construits les polynômes h;,, i = 1,...,5,j = 1, ..., k,, de degrés 
inférieurs à &, pour lesquels 


hÿ-D (x) = { 


Décrivons la construction de ces polynômes. Considérons pour chaque / 
le polynôme 


En k; 
| 4 @ = +) | 


il ! 


1 pour i = let j = m, 


17 
0 pour : + lou j 4 m. (0 


Il est aisé de vérifier que pour tout i # /et tout j < &; 
uYD(X) = 0. (18) 
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Cela signifie que u, vérifie les conditions (17) aux points X,, i # /, mais, en 
général, ne les vérifie pas au point NÀ,. Pour remédier à ce défaut, notons 
que les propriétés (18) se conservent pour tout produit par un polynôme 
W(£) : 
d/-! | 
dé”! (u,w) _. nu 0, LÉ {, J < k. 


t 


Cela découle de la formule de Leibniz. Choisissons le polynôme w de la 
façon qui nous convient. 

Soit ,, (£) le polynôme de Taylor obtenu par décomposition de la fonc- 
tion 1/u, suivant la formule de Taylor au voisinage du point À, à 
O((£ — À,)") près. On obtient 

| 


h,,(&) = u,(£) (m= 1)! (Er À JS, 47= m &)- (19) 


Ce polynôme permet une représentation différente : 


bn = EE E = ANT UE b + o(E - Apt) | = 


— À)! + o((E — À)! 
= — mé u(E)O((E — À,)k71). 
Démontrons que le polynôme (19) satisfait aux conditions (17). Pour tous 
lesj < k,on a(u,(E)o((E — RE ET = Oselon la formule de Leibniz, 
vu que les k;°— 1 premières dérivées de la fonction o((£ — À,)“7!) au point 
À, sont nulles. Donc, les k, — 1 premières dérivées du polynôme h,, au 


point À, sont les mêmes que celles de DT (£ — À,)771, c’est-à-dire 
hU-D(X dm 
ON) = k 0, j 4 m. 


Le polynôme u,, est de degré & — k,. Le produit des deux autres fac- 
teurs de (19) est de degré <m — 1 + k, — m, de sorte que le degré du 
polynôme h,,, est < k — 1. La démonstration est ainsi achevée. 

Le procédé général de calcul des matrices composantes de la matrice À 
consiste en la substitution de À dans les formules (19), vu que Z, = h;, (A) 
pour tous les ; et j. Toutefois, il n’est pas inutile de noter un procédé plus 
efficace quoique moins général. 

On peut porter dans la décomposition (15), au lieu de jf, des polynômes 
quelconques, par exemple les diviseurs du polynôme minimal ou tout sim- 
plement les puissances de la matrice 4. On obtient ainsi un système d’équa- 
tions linéaires à coefficients numériques par rapport aux matrices L; . Siles 
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polynômes ont été bien choisis, en résolvant ce système on obtient facile- 
ment les matrices composantes. 


EXEMPLE. Soit 
2 — 1 
= |: 
0 1 


Etant donné que c’est une matrice d’ordre deux à spectre simple et À, = 1, 
À, = 2, la formule (15) prend la forme /(A4) = f(1)Z,, + /(2)Z,,. Rem- 
plaçons j par les polynômes £ — 1 et £ — 2. Il vient immédiatement 


1 — 0 1! 
=] ot Z-l6 
21 0 ) Zi 0 1 


Donc, 
4=50 0 [+rels | 


En particulier, comme on l’a vu à la p. 350, 
e? e— “| 
0 e : 


ou pour la fonction £”, avec un 7 naturel, 


2" dd 
A" = ; 
É 


eA = 


1 


8. Extension des identités aux matrices. Posons que la fonction régu- 
lière g(£) est égale à zéro sur le spectre de la matrice 4. Alors g(4) = O. 
Appliquons cette propriété à la fonction de la forme 


8) = GUE), …, j,E)) = 0, 


où G = 0 est une identité reliant les fonctions régulières f,, …, f,.. Si la 
fonction g(£) est régulière, on voit que g(4) = O et par suite, l’identité se 
conserve aussi pour la matrice À. 

Dans deux cas importants la régularité de la fonction g(£) est hors de 
doute. 

1) G(n,, ……, n,) est un polynôme. On peut étendre aux matrices toute 
identité de type considéré, dont le premier membre est un polynôme de 
fonctions régulières. Considérons par exemple l'identité sin? £ + 
+ cos? £ = 1. La fonction g(£) = sin? £ + cos? £ — 1 = O0 est régulière 
et s’annule sur le spectre de toute matrice. Aussi pour toute matrice À a-t- 
on 


sin? À + cos? À = E. 
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On a trouvé plus haut les matrices composantes de 


2 —1 
A = : 
6 à 
En se servant d’elles, on obtient 
29 _<in2 : 2 2 9: nn 2 
in 4 = |" 2 —sin 2+sin ] oAel 2 —cos* 2 + cos’ 1 
0 sin? | 0 cos? 1 


Maintenant on peut se convaincre immédiatement que l’égalité est vraie 
pour cette matrice. 

2) Soient f une fonction régulière d’une seule variable et À une branche 
régulière de la fonction réciproque, qui est définie dans le domaine conte- 
nant le spectre de la matrice À. Dans ce cas, la fonction g(£) = 
= h(f(£)) — £ est régulière et l’identité hA(F/(£)) = £ se vérifie de même 
pour la matrice A. 

A titre d'exemple, définissons la fonction £!/?2 comme une somme de la 
série 


| ] 
1/2 = ] + ns A | ee —— 1 + .. 
£ 3 (E ) g (E Ÿ 
Vu que la fonction (£!/2} — £ est régulière, la valeur 


A=E+S(A4-E)- (AE) +. 


vérifie l’égalité (4!/2} = À pour toute matrice À dont les nombres carac- 
téristiques appartiennent au disque l£ — 11 < 1. Donc, 4!/2 peut être 
interprété comme la racine carré de À. Soit 


o | 
0 2 


Les nombres caractéristiques de cette matrice sont 3 et 2. La matrice 
A — E est justement la matrice dont les matrices composantes ont été cal- 
culées. Aussi la somme de la série est-elle égale à 


x-8f +2 1-0 a 


En élevant X au carré, on obtient la matrice A. 

Il convient de souligner que les identités comprenant deux variables 
indépendantes ne sont plus vraies pour les matrices. Cela s’explique par la 
non-commutativité de la multiplication des matrices. L’exemple classique 
est fourni par 


4 =| 


eA -eB £ e4+B, 
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où À et B sont des matrices quelconques. Or si les matrices sont commuta- 
bles, on obtient une égalité. On peut s’en convaincre en multipliant les 
séries entières. 

9. Prolongement analytique. A propos de l’exemple, discuté plus haut, 
de l’extraction de la racine carrée de la matrice il faut faire deux remarques 
importantes. D'abord, par cette voie, on n’a obtenu qu’une des matrices X 
vérifiant l’équation X? = À et possédant donc le droit d’être appelée 
racine carrée de À. Ensuite, on est en mesure de trouver À !/2 pour les seules 
matrices dont les valeurs propres se trouvent à l’intérieur du disque de con- 
vergence, bien que la racine carrée existe aussi pour d’autres matrices. 

Il va de soi que de telles remarques se rapportent non seulement à la 
racine carrée mais également à de nombreuses autres fonctions, par exem- 
ple au logarithme. Le lecteur versé dans la théorie des fonctions d’une 
variable complexe notera que les deux questions sont étroitement liées entre 
elles et se rapportent à la possibilité de prolongement analytique de la fonc- 
tion régulière d’une matrice. Leur résolution n’a rien de compliqué mais se 
rapporte davantage à l’analyse qu’à l’algèbre linéaire. Aussi n’appro- 
fondira-t-on pas cet aspect de la question. 

Notons seulement qu’on est en mesure de définir une fonction régulière 
pour les matrices dont les valeurs propres n’appartiennent pas au disque de 
convergence de la série définissant la fonction. Il suffit pour cela de pou- 
voir obtenir la valeur de la fonction sur le spectre de la matrice qui nous 
intéresse. Alors, en appliquant le polynôme de Lagrange, on peut détermi- 
ner la valeur de la fonction sur la matrice. Le lecteur peut trouver un meil- 
leur exposé d’argumentation de ce procédé dans la source PIETIErS 
l'ouvrage de Lappo-Danilevski [23]. 

Donnons un exemple. La matrice 


a=f 7] 
1 —2 
présente les nombres caractéristiques V3 et —V3. Ils sont tels que tout dis- 
que les contenant contient aussi zéro. Il s'ensuit qu'aucun développement 
de la fonction !/£ en série entière ne peut converger en même temps en 
deux points V3 et —V3. Or la fonction y est définie et prend les valeurs 
(V3)-! et (— V3)-!. Cherchons les matrices composantes de la matrice À : 
1 [2 + V3 — ] 
Zee 
2 V3 ] —-2 + V3 
1 |2— V3 —] 
2931 ! —2- V3 


Leur substitution dans l'expression (V3)-!Z,, + (—V3)-!Z,, nous fournit 


Zn = — 
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la matrice 


2/3 —1/3 
1/3 —2/3 | 


qui est en effet la matrice inverse de 4. (Cet exemple illustre le prolonge- 
ment des fonctions régulières de matrices au moyen du polynôme de 
Lagrange mais ne doit pas être pris pour un procédé commode d’inversion 
des matrices d’ordre deux.) 

La décomposition spectrale, autrement dit le polynôme de Lagrange, 
n’est pas le seul polynôme à l’aide duquel on peut calculer les fonctions 
d’une matrice. Il est manifestement suffisant que les valeurs de ce poly- 
nôme sur le spectre de la matrice coïncident avec les valeurs de la fonction. 
Indiquons ce polynôme pour la fonction £-!. 

Selon le théorème de Cayley-Hamilton, la matrice À vérifie son équa- 
tion caractéristique 


A" +a4"-l+...+a _A+aE= oO, 
où a, = det 4. Sia, # 0, on peut écrire 
a-lA(A"-1 + a A4"? + …. + a,_,E)=E, 


d’où on obtient l’expression de À - ! sous forme de polynôme de À. 

L’utilité pratique de ce procédé d’inversion d’une matrice n’est pas 
grande, car le calcul des coefficients du polynôme caractéristique est une 
opération laborieuse. Toutefois, si le polynôme caractéristique présente un 
intérêt en soi, on peut en même temps trouver la matrice inverse. L’algo- 
rithme de recherche des coefficients du polynôme caractéristique et de la 
matrice inverse est donné dans la littérature spéciale. 

10. Nombres caractéristiques de la fonction régulière. Démontrons la 
proposition suivante. 


PROPOSITION 9. Si f est une fonction régulière, les racines du polynôme 
caractéristique de la matrice f(A) sont f{(X,), .…, f(À,), où À,, …, À, sont 
les racines du polynôme caractéristique de la matrice À. 


DÉMONSTRATION. En se servant de la proposition 1, on peut remplacer la 
matrice À par la matrice de Jordan À ‘ telle que 4 ’ = S-! 48. La forme 
de la matrice f(/), où J est un bloc de Jordan d’ordre quatre, a été obtenue 
dans l’exemple 2 à la p.350 et se généralise aisément aux blocs d'ordre 
quelconque. Pour f(4')ona 


SCA”) = diag (J,) … f(JL)), 


d’où l’on voit que tous les éléments dans f(4 ”?) qui sont situés au-dessous 
de la diagonale principale sont nuls, quant aux éléments diagonaux, ce sont 
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les nombres f(À,), ..…., f(ÀA,) répétés autant de fois qu’il est nécessaire. 
Donc, 


det (4 7) — AE) = À — JA). À — JA), 


ce qui est équivalent à l’assertion qu’il fallait démontrer. 

Le déterminant de la matrice est égal au produit de ses nombres caracté- 
ristiques, et la trace, à leur somme (chaque nombre étant compté autant de 
fois qu'est sa multiplicité dans le polynôme caractéristique). D’où on 
obtient l’égalité suivante : 


det e4 = et"A, 


& 4. Localisation des racines d’un polynôme caractéristique 


1. Introduction. Le problème de localisation des nombres caractéristi- 
ques de la matrice consiste dans la recherche des conditions et des estima- 
tions qui permettent, d’après les éléments de la matrice, d’indiquer la posi- 
tion approximative des racines du polynôme caractéristique sur le plan 
complexe. N 

En principe, les éléments de la matrice permettent évidemment de déter- 
miner les valeurs exactes des nombres caractéristiques, mais ces valeurs ne 
sont pas toujours nécessaires. Par ailleurs, les estimations proposées doi- 
vent être moins laborieuses que la résolution de l’équation caractéristique. 
En parlant de la localisation des nombres caractéristiques, il ne faut pas 
oublier qu'ils sont des invariants et que par suite, l’application de l’un quel- 
conque des théorèmes de localisation à la matrice S-! AS, au lieu de la 
matrice À, indique la position des mêmes nombres, mais peut fournir une 
estimation plus (ou moins) précise. Un choix convenable de la matrice S 
peut entraîner une excellente estimation jusqu’à mention précise des raci- 
nes, mais ce choix est difficile. 

L'intérêt qu’on porte à la localisation des nombres caractéristiques est, 
en premier lieu, lié à ses applications aux différents problèmes de théorie de 
la stabilité d’équations différentielles ordinaires et, de ce fait, à un grand 
nombre de problèmes pratiques. En second lieu, l’application de certaines 
méthodes numériques de résolution des problèmes (même de ceux, qui 
n’ont apparemment pas de rapport avec les nombres caractéristiques, 
comme par exemple les systèmes d’équations linéaires) exige une localisa- 
tion, même peu exacte, des nombres caractéristiques des matrices étudiées. 
A plus forte raison, tout cela se rapporte au problème de recherche des vec- 
teurs propres et des valeurs propres où une localisation préalable des nom- 
bres caractéristiques simplifie considérablement la résolution. 

La localisation des nombres caractéristiques d’une matrice est intime- 
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ment liée à celle des racines d’un polynôme d’après ses coefficients. Mais la 
recherche du polynôme caractéristique présente des difficultés et ne simpli- 
fie pas le problème. Pour localiser les racines d’un polynôme d’après ses 
coefficients, il vaut mieux plutôt utiliser de nombreux résultats de localisa- 
tion des racines d’un polynôme caractéristique d’après les éléments de la 
matrice. À cet effet, on peut construire une matrice pour laquelle le poly- 
nôme considéré est un polynôme caractéristique. A titre d'exemple d’une 
matrice de polynôme caractéristique 


M +otl+.. + at + a 


n 


peut servir la matrice 


0 | 0 0 

0 0 | 0 

0 0 0 | 
SE 


Elle est appelée matrice d'accompagnement du polynôme donné. 

Notons encore un domaine qui se rattache intimement à la localisation 
des nombres caractéristiques. C’est la théorie des perturbations des nom- 
bres caractéristiques qui explique de quelle façon doivent varier les nom- 
bres caractéristiques et leurs multiplicités avec la faible variation 
(« perturbation ») des éléments de la matrice. Faute de place, on n’abor- 
dera pas ces résultats, bien que leur importance pratique soit si grande. Elle 
est liée aux inévitables erreurs avec lesquelles nous est présentée l’informa- 
tion initiale dans tout problème ainsi qu’aux erreurs d’arrondi aussi inévi- 
tables. Sous ce rapport, on fournira quelques renseignements au point 4 du 
$ 2, ch. XIII ; l’exposé détaillé de la théorie des perturbations peut être 
trouvé dans les livres de Lankaster [22] et de Wilkinson [42]. 

Les liens mentionnés ci-dessus de la localisation des valeurs propres 
avec d’autres sujets en ont fait une branche importante de l’algèbre 
linéaire, riche en résultats variés. Dans le cadre d’un enseignement général, 
il est peut-être inutile d'étudier en détail tous ces résultats, aussi va-t-on 
présenter les théorèmes les plus simples et importants. 

2. Estimations des modules des nombres caractéristiques. Introduisons 
la définition suivante. 

DÉFINITION. Soient X,, i = 1, .…, s, les nombres caractéristiques de la 
matrice À. Le nombre À, = max |}, | est appelé rayon spectral de la 


matrice À. 
Il va de soi que le rayon spectral est un nombre réel positif qui s’annule 
si et seulement si la matrice est nilpotente. 
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PROPOSITION 1. Si la norme | x | possède la propriété annulaire, le rayon 
spectral de la matrice À ne dépasse pas la norme de cette matrice : 
\, < NAÏ. 


DÉMONSTRATION. Soit À, le nombre caractéristique pour lequel 1 À,| = 
= À, et soit A = À£,£ # 0. Notons X la matrice carrée d’ordre n dont 
la première colonne est £ et les autres colonnes sont nulles. Il est évident 
que AX = À, X. Considérons les normes des deux membres de l’égalité. 
On a IA,I HAN = LAXÏ < TA EXT. Vu que IX > 0, on obtient l’iné- 
galité qu'il fallait démontrer. 

En appliquant la proposition 1 aux diverses normes (voir $ 3, ch. XI), 
on obtient les majorations suivantes du module d’un nombre caractéristi- 
que arbitraire : 


a) IN < ( ae)" 
Ü 
b) IX,I < n max la, 


U 
c) IA,I < max D la, PYARE< max y la;l, 
E j 


d) IÀ,l < a, pour la norme spectrale (a, est ici le nombre singulier 
maximal de la matrice À). 

La dernière inégalité peut être complétée par la borne inférieure. Plus 
précisément, on a la 


PROPOSITION 2. Les modules des nombres caractéristiques de la matrice 
A sont compris entre ses nombres singuliers minimal et maximal. 


Pour le démontrer, considérons la matrice-colonne £ satisfaisant à la 
condition A£ = À, £. Soient comme toujours £* = '£ et NEW? = £*E£. On 
supposera que H£I = 1. Alors 


IA, 12 = HAËN = (AË)*AE = E*(A*A)E. 


Par ailleurs, selon la formule (9) du $ 2, ch. XI, la grandeur £*(4 “A )£ est 
comprise pour El = 1 entre les nombres caractéristiques minimal et 
maximal de la matrice À *4, autrement dit entre œ et o , Où a, et æ, Sont 
les nombres singuliers minimal et maximal. On aboutit ainsi à la double 
inégalité équivalente à l’assertion nécessaire a < IA, 1? < of. 

3. Estimations des parties réelles et imaginaires des nombres caractéris- 
tiques. En fait, le même procédé de réduction à une matrice hermitienne, 
utilisé lors de la démonstration de la proposition 2, peut être appliqué à la 
démonstration de l’assertion suivante. 


PROPOSITION 3. Posons que les matrices S et T sont définies par les égali- 


tés S = : (A + A e T = _ (A — AÀ*. Dans ce cas, pour tout nom- 
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bre caractéristique X, de la matrice À, on a 

u < REA <u, v  <ImÀ <p,, 
où u,, v, el 1, v, Sont respectivement les nombres caractéristiques mini- 
maux et maximaux des matrices S et T. 


Démontrons la première double inégalité. Soient A = À£ et 
I£N = 1. Alors £*4* = À £* et il vient 


E*SE = à (E*AE + E*A"E) = à Œ'NE + EE) = (ReXJE*E = Re. 


Or pour IE = 1 le nombre £*SE est compris entre y, et u,. La seconde 
double inégalité se démontre de la même façon. 

En considérant que la matrice À est complexe, on peut profiter du théo- 
rème 3, $ 2, ch. XI, selon lequel il existe une matrice unitaire U telle que la 
matrice R = U-!'AU est triangulaire supérieure. Les éléments diagonaux 
de R sont les nombres caractéristiques À. de la matrice À. La norme unitaire 
(hermitienne) de la matrice R peut être calculée ainsi : 


WRIZ = Dr = y LA 12 + y Ir, > y PA, 12. 
1. i i 


1<J 


Or la norme unitaire de la matrice À ne varie pas quand on multiplie À à 
gauche ou à droite par la matrice unitaire. Donc, 


LA, > SIA. (1) 


Ceci étant, on a l’égalité si et seulement si tous les r; = O(i < j), c’est-à- 
dire que la matrice R est diagonale. 

Recherchons quelques corollaires de l’inégalité (1). 

Notons U* la matrice ‘U. Alors pour la matrice unitaire U on a 
U* = U-! et par suite, R* = (U*AU)* = U*A*U. D'où, pour la 
matrice S définie dans la proposition 3, 


U*SU = ; U*“A + AU = 2 (R + R°). 


Les éléments diagonaux de la matrice à (R + R*) sont égaux à Re À, 


i = ]1,..., n, et pour la norme unitaire de la matrice S, on obtient 


1S1, = Ÿ (REX? + > D (sy + 5,) > 7. Re, 12. 
im) it i=) 
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De façon analogue on démontre que 


ITIF, > Y'iIml?, 
im] 


où la matrice 7 est définie dans la proposition 3. 
Au $ 3 du ch. XI on a vu que la c ‘-norme de la matrice est supérieure à 
sa norme euclidienne. Le même résultat est assurément vrai pour la norme 


unitaire : 
AI, <n max la; | = TAN... 


En l’appliquant aux matrices S et 7, on obtient 


n 1/2 
ÎRe X,| <(5 IReN 12) < SI, < ASK, 


t=] 


et finalement 


Re À, < n max 
4, J 
D'une façon analogue, 


a.. de 
[im X,! < n max | 


On a montré que 1 A1, = tr À*A. Or 


n 


tr A*A = ÿ æ, 


t 
im] 
où à; sont les nombres singuliers de À. Aussi l’inégalité (1) signifie-t-elle 
que 


Y'IAII< Ÿ a, 
im] im] 


et l’égalité a lieu si et seulement si À est une matrice normale. 

4. Disques de localisation. On dira que la matrice À d'ordre n possède 
une diagonale principale dominante si le module de chacun de ses éléments 
diagonaux est strictement supérieur à la somme des modules des autres élé- 
ments de la même ligne : 


la;l > Ÿ la,l pourtousles i = 1,...,n. (2) 
Kai 


PROPOSITION 4. Si la matrice À possède une diagonale principale domi- 
nante, det À # 0. 
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En effet, si det À = 0, il existe une solution non triviale du système 
d’équations linéaires A£ = 0. Soit £’ la composante maximale en module 
de cette solution. En portant £& dans la i-ième équation du système, on 


obtient 
; — k& 
la£'l = ÿ at ; 


kæi 
d’où 
la,L ET < y la, ,l1£#1 < 1£'| D la, |, 


kæi kæi 


ce qui est contraire à l'hypothèse. 

En appliquant la proposition 4 à la matrice transposée, on voit que, 
pour que la matrice À soit de déterminant non nul, il suffit également que 
les éléments de la diagonale principale dominent les éléments des colonnes, 


c’est-à-dire que 
la, > y la,,l. 
kæi 


Soit donnée une condition quelconque imposée à la matrice 4, sous 
laquelle det À # 0. On peut l’appliquer à la matrice À — XE et obtenir un 
ensemble de points du plan complexe qui ne contient aucune racine du 
polynôme caractéristique de 4. On montrera par là que toutes les racines se 
trouvent dans l’ensemble complémentaire de £. Ces raisonnements sont 
utilisés pour démontrer une série de théorèmes de localisation. Profitons- 
en, ainsi que de la proposition 4. 


PROPOSITION S. Tous les nombres caractéristiques de la matrice À appar- 
tiennent à la réunion des disques 


mal < Ylal, i=1,..,n. (3) 


ka! 


En effet, si le nombre X n'appartient pas à la réunion de ces disques, 
chacune des conditions (3) doit être perturbée et par suite, la matrice 
A — XE doit posséder une diagonale principale dominante. 

On appellera les disques (3) disques de localisation de la matrice À. Si 
a, = Opour k # i, le i-ième disque se réduit en un point. Pour la matrice 
unité par exemple, la réunion des disques contient un seul point. 

Pour préciser le sens des deux dernières phrases, introduisons un fac- 
teur devant les éléments non diagonaux de la matrice À et étudions la fonc- 
tion matricielle F(t) à éléments j(1) = a,etf,.(f) = ta, sii # k, définie 
pour { € [0, 1]. Si £ — 0, les rayons des disques de la matrice F(f) tendent 
vers Zéro, tandis que les centres demeurent immobiles. 

Utilisons, sans le démontrer, le théorème qui affirme que les racines 
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d’un polynôme sont des fonctions continues de ses coefficients (voir 
Ostrowski [30]). Les coefficients du polynôme caractéristique de la matrice 
F(+) sont des polynômes de ses éléments et par suite, des fonctions conti- 
nues de f. Pour cette raison, les nombres caractéristiques de F(t) sont aussi 
des fonctions continues de £. Lorsque £ varie de 1 à 0, chacune des racines 
décrit sur le plan complexe un arc continu. Plus précisément, pour chaque 
nombre caractéristique À, de la matrice À il existe un arc continu d’origine 
en À, et d'extrémité en un point 4,. Ceci étant, chaque point a; est l’extré- 
mité d’un arc au moins. 

Pour nous représenter les possibilités éventuelles, considérons l’exem- 
ple suivant. Soit 


| | — ] { 
4 —5 D = y _s 
Les nombres caractéristiques de F(t) sont À, = —-3 + 2V1 -#r2 et 


À = —3 —2V1 — #2. Lorsque t diminue de 1 à O, ils varient respective- 


ment de —3 à — 1 et à V-5. Sir > 4/5, aucun des nombres caractéristi- 
ques ne tombe dans le petit disque IX + 11 < #. Pour f < 4/5, l’un d’eux 
se trouve dans le petit disque et l’autre, dans le grand IX + 51 < 4£, et les 
deux disques sont disjoints (fig. 53). 


24—6442 
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Les arcs auraient pu ne pas avoir de points communs,avoir une même 
extrémité et les origines différentes, etc. 

Si l’un des disques de localisation de la matrice À ne coupe pas les 
autres, il en est de même du disque correspondant de la matrice F(#) pour 
tout / € [0, 1]. Cela signifie qu’un arc d’extrémité au centre de ce cercle y 
est contenu tout entier. En effet, si les disques sont disjoints, le nombre 
caractéristique ne peut parvenir à aucun autre disque par un mouvement 
continu sans passer par les points n’appartenant pas à la réunion des dis- 
ques. Vu que pour tout ! il doit se trouver dans un disque au moins, il res- 
tera dans le disque considéré. Ainsi donc, si l’un des disques de localisation 
de la matrice À ne coupe pas les autres, il contient au moins un nombre 
caractéristique. Il se peut qu'il en contient plusieurs, ce que montre l’exem- 
ple suivant. La matrice 


5 1 0 
0 1 2 
0 2 1 


possède deux disques de localisation disjoints IX — 11 < 2et IX — SI < 1. 
Dans le premier d’entre eux, se trouvent deux nombres caractéristiques — 1 
et 3. 

Il est toutefois facile de remarquer que le premier disque est engendré 
par la deuxième et la troisième ligne de la matrice et par suite, on est en 
droit de le compter deux fois. 


PROPOSITION 6. Compte tenu de la multiplicité des disques de localisa- 
tion et des nombres caractéristiques, l'ensemble de r disques de localisation 
ne se coupant pas avec les autres n — r disques comporte exactement r 
nombres caractéristiques. 


Cette proposition se démontre à l’aide des considérations mentionnées 
plus haut et on laisse au soin du lecteur d'effectuer la démonstration s’il en 
a l'intention. 

COROLLAIRE. Si un disque non multiple de la matrice réelle ne se coupe 
pas avec les autres, il contient une racine réelle. 


En effet, dans le cas contraire, la racine complexe conjuguée aurait dû 
s’y trouver, vu que le centre du disque est situé sur l’axe réel. 

S. Remarques et corollaires. On peut obtenir un deuxième ensemble de 
disques de localisation en utilisant les colonnes au lieu des lignes : tous les 
nombres caractéristiques de la matrice se trouvent dans la réunion des dis- 
ques 

[À — al < D la,,l. 
Kæi 


On peut ainsi préciser la disposition des racines. 
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Un autre procédé d’amélioration des estimations considérées consiste 
dans l’application de ces dernières à la matrice S -! 48. Si S est une matrice 
diagonale, chaque ligne de À devient multipliée par un certain nombre, 
tandis que la colonne de même numéro, par le nombre inverse. Les centres 
des disques restent donc immobiles, tandis que les rayons changent de 
valeur. On peut essayer de choisir S de manière qu’ils diminuent. 

Les autres domaines de localisation, différant des disques, peuvent être 
obtenus à l’aide de la proposition 9 du $ 3. Soit B = p(A) un polynôme de 


A. Il vient alors 
IPN) — b;l < y lb, 1. (4) 


Kæ: 


Les domaines de ce type peuvent fournir une localisation très précise, mais 
son utilisation présente des difficultés. Dans le cas limite où p est un poly- 
nôme caractéristique, (4) se réduit à la condition p(\) = 0. 

Les disques de localisation permettent d'estimer les parties réelles et les 
modules des nombres caractéristiques. Par exemple, pour tout nombre 
caractéristique à, 

Re À < max [Re a; + ÿ la, | 
kæ: (5) 
Re À > min [Re a. — D la,,.| | 
kæi 


car les points extrêmes gauche et droit dans le ;-ième disque sont les points 


kæ: kw: 


Vu que IX — a;l > IXI — la;l, il existe un à tel que 


n 
AU & la; + Slal = Slal, 
K=1 


ak 


et l’on aboutit, une fois encore, à la majoration c) de la p. 365. D’une 
façon analogue, en utilisant les colonnes et non pas les lignes, on obtient la 
majoration 


n 
AA < Ÿ ll. 
Km]! 


Soit u la somme maximale des modules d’éléments suivant les lignes, et v la 
somme maximale des modules d'éléments suivant les colonnes. On peut 
alors généraliser les inégalités obtenues plus haut et écrire 


[Xl < min (u, v). 
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Considérons la matrice À pour laquelle les conditions (2) ne sont pas 
satisfaites pour toutes les valeurs de ; mais seulement pour r d’entre elles. Il 
découle de la proposition 4 qu’il existe dans À une sous-matrice d’ordre r 
avec la diagonale principale dominante, et donc, un mineur d’ordre r diffe- 
rent de zéro, d’où Rg 4 > r. 

Supposons maintenant que pour un nombre caractéristique À, de la 
matrice À, le rang de la matrice À — NE vaut r. Dans ce cas, aucun 
mineur d’ordre r + 1 ne peut posséder une diagonale principale dominante 
et, par suite, la condition (2) est violée pour #7 — r valeurs de l'indice à. 
Cela signifie que le nombre \, se trouve dans les ñ — r disques. D’où la 


PROPOSITION 7. Si à la valeur propre \, de la transformation À corres- 
pondent n — r vecteurs propres linéairement indépendants, X, appartient à 
n — r disques de localisation de la matrice À associée à la transformation 
A. 

Les formules (5) entraïnent la condition suffisante suivant laquelle la 
forme quadratique est définie positive : 


PROPOSITION 8. Si la matrice associée à la forme quadratique possède 
une diagonale principale dominante dont les éléments sont strictement 
positifs, la forme quadratique est définie positive. 


En effet, selon (5), tous les nombres caractéristiques de la matrice sont 
strictement positifs. 

Tout ce qui vient d’être dit ici suffit pour se représenter les applications 
possibles des disques de localisation. 

Les théorèmes de localisation mentionnés dans ce paragraphe se 
démontrent facilement et leur application est aisée. Certains résultats 
importants de cette théorie ne possèdent pas lesdites propriétés et ne peu- 
vent être exposés ici. Ceci se rapporte en particulier aux critères de 
Raousse-Gourvitz et de Liapounov. Ils fournissent les conditions nécessai- 
res et suffisantes pour que tous les nombres caractéristiques de la matrice 
présentent des parties réelles négatives. Le lecteur peut s'initier à ces ques- 
tions en s'adressant à des ouvrages spéciaux traitant de la théorie des matri- 
ces, par exemple au livre de Gantmacher [12]. 


CHAPITRE XIII 


INTRODUCTION AUX MÉTHODES NUMÉRIQUES 


$ 1. Introduction 


1. Objet du chapitre. Aujourd’hui, un ingénieur ou un chercheur 
s’adresse tout naturellement à un ordinateur pour résoudre un système, 
quelque peu important, d'équations linéaires. Il existe pour cela des pro- 
grammes efficaces qui fonctionnent parfaitement. Aussi pour la plupart 
des lecteurs de ce livre, la résolution pratique d’un système d’équations 
linéaires se réduit-elle à la recherche d’un programme ou d’un procédé 
standard. Toutefois, pour bien poser le problème, choisir le programme et 
interpréter les résultats, il est très important de connaître les algorithmes 
utilisés, ainsi que les difficultés principales auxquelles on se heurte au cours 
de la résolution des systèmes linéaires, et les moyens permettant de les sur- 
monter. C'est de quoi on parlera dans le présent chapitre. 

Il va de soi que le logiciel de l'ordinateur se perfectionne constamment. 
La mise au point de nouveaux algorithmes et programmes permettant de 
résoudre les problèmes d’algèbre linéaire demeure un sujet d’actualité. 
Mais il faut avoir en vue que la composition d’un programme plus efficace 
que celui qui existe déjà est une entreprise laborieuse, exigeant non seule- 
ment des connaissances profondes mais aussi une expérience pratique. 
C'est pourquoi, pour tous ceux qui se préparent à cette activité, le présent 
chapitre n’est qu’une entrée en matière. Sous ce rapport, remarquons que 
l’exposé suffisamment exhaustif des résultats de tout paragraphe de ce cha- 
pitre peut remplir tout un volume. 

On étudiera en grands traits dans le premier paragraphe les principales 
difficultés auxquelles on se heurte dans la résolution numérique des problé- 
mes d’algèbre linéaire. En fait, on passe dans le chapitre XIII au domaine 
des mathématiques appliquées dont les difficultés sont spécifiques à la 
branche. 

2. Erreurs d’arrondi. Une des plus manifestes particularités des mathé- 
matiques appliquées est la prise en considération des erreurs d’arrondi. 
Ceci est lié au fait que le registre de l’ordinateur ne peut contenir qu’un 
nombre fini de caractères. Pour fixer les idées, on parlera de chiffres déci- 
maux, bien que les ordinateurs utilisent plus souvent le système binaire ; on 
se sert aussi d’autres systèmes de numération qui ont pour base 8 ou 16. Les 
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nombres qui ne peuvent être représentés par une suite décimale finie, et de 
plus suffisamment courte, doivent être arrondis et, par suite, ne peuvent 
présenter à l’ordinateur leurs valeurs exactes. Le perfectionnement des 
moyens techniques peut augmenter la précision mais non pas lever le pro- 
blème. 

Il ne faut pas penser que l’ordinateur seul est responsable de ces défauts 
dans la représentation des nombres. Puisqu’il est impossible d’écrire un 
nombre infini de chiffres, toute suite décimale illimitée représentant un 
nombre réel doit être tronquée. On peut évidemment (et on le fait souvent) 
représenter les nombres rencontrés par des symboles tels que V2 et les 
manipuler ensuite en obtenant des résultats exacts de type V2 — e2. Mais 
on ne peut utiliser ce résultat à autre chose qu’à la comparaison avec les 
réponses citées dans un recueil de problèmes. Pour qu’on puisse l’utiliser, 
on doit le calculer ou estimer et, par suite, arrondir. D’autre part, on peut 
se limiter aux nombres rationnels et les manipuler comme les fractions 
ordinaires. Mais s’il s’agit d’effectuer un nombre assez important d’opéra- 
tions arithmétiques, on aboutit à des fractions dont les numérateurs et les 
dénominateurs sont très grands, qu’en fin de compte on sera obligé 
d’arrondir. Ainsi donc, dans les calculs numériques, les erreurs d’arrondi 
sont aussi inévitables que le sont en physique les erreurs de mesure. 

Notons que les possibilités d’augmenter la précision sont en principe 
très grandes. En utilisant les programmes spéciaux, on peut représenter les 
nombres et effectuer sur eux les opérations arithmétiques avec une préci- 
sion de loin supérieure à la précision ordinaire (voir, par exemple, Dreyfus, 
Gangloff [6]). Toutefois, même deux cents chiffres décimaux ne consti- 
tuent qu’une représentation approximative des nombres. En outre, la mise 
en œuvre de tels procédés augmente le temps de calcul jusqu'aux grandeurs 
inadmissible dans un travail réel. Aussi pour les problèmes d’algèbre 
linéaire une telle approche n’a-t-elle pas d’intérêt pratique. 

Considérons deux procédés principaux de représentation approchée des 
nombres. 

1) Représentation en virgule fixe. Notons F, , l’ensemble des nombres 
positifs et négatifs écrits avec r chiffres décimaux dont t chiffres après la 
virgule représentent la partie fractionnaire. L'ensemble F, , est fini, bien 
qu’il contienne un nombre élevé d'éléments si r est assez grand. Le nombre 
réel a peut être représenté approximativement par un nombre de F, , si la 
partie entière de a est inférieure à 10°’, autrement dit, peut être écrite par 
r — t chiffres décimaux. 

Dans cecas,ouaeF, ,ouil existe dans Fe des nombres a ‘et a ”, qui 
sont respectivement le plus grand minorant “ le plus petit majorant du 
nombre a. Si la — a’i < la — al , on dit que a° est la représentation 
approchée de a par les nombres de Ps dans le cas contraire, c’est a ” 
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Le nombre a se trouve dans l'intervalle ]Ja”, a ’{ et, par suite, sa dis- 


,, 


LR] ° e [4 ° Q] | * e e 
tance à l’une de ces extrémités est au plus égale à 3 (a” — a‘). Il est évi- 


dent que a” — a’ = 107’, d’où la proposition suivante. 
PROPOSITION 1. Si le nombre a est approché par un nombre a de F, ,,le 


module de l’erreur absolue |\a — al ne dépasse pas > 107", 


2) Représentation en virgule flottante. Soit u un nombre de l'intervalle 
[0,1, 1[ appartenant à l’ensemble F, ,;, et soit £ un nombre entier de 
module inférieur à p. On notera E, Gp l’ensemble des nombres de la forme 
+u"10%. Le zéro est aussi inclus dans E, p' Le nombre u est appelé man- 
tisse et k ordre d'un nombre de E, 

Si le nombre a est en module férieur à 107 et supérieur à 107P, il 
représenté par un nombre a de E,; ,. A cet effet, on l'écrit sous forme ‘de 
+m:10#, où me [0,1, 1[ et & un nombre entier. Ensuite, on représente m 
de façon approchée par un nombre y de F, ,. Dans ce cas, l'erreur absolue 


a — ane dépasse par en module > 10*-d, Pour le module de l’erreur rela- 


tive on a . — 
10 10 L L'hoi-a 


2lai — 2mi0t 2 
vu que M7! < 10. Ainsi donc, on a la proposition suivante. 


PROPOSITION 2. Si le nombre a peut être approché par un nombre de 
E’, l'erreur relative de cette approximation ne dépasse pas en module 


: 10!-4, où d est le nombre de chiffres de la mantisse. 


Chacune de ces représentations a ses avantages. La représentation des 
nombres en virgule fixe rend les opérations arithmétiques plus rapides, 
mais l’ensemble des nombres représentés sous cette forme est assez res- 
treint. La représentation des nombres en virgule flottante est plus étendue, 
grâce à la possibilité de représenter sous cette forme les nombres qui diffè- 
rent fortement en grandeur. Pour plus de détails, voir par exemple le livre 
de Voïévodine [40]. 

Il faut se représenter de façon absolument nette que les opérations 
arithmétiques ordinaires ne sont pas des opérations sur les ensembles F 
ou Eh , Vu que les résultats de ces opérations sur les éléments de l’un quel- 
conque de ces ensembles n’appartiennent généralement pas à cet ensemble. 

Aussi définit-on en fait de nouvelles opérations qui approchent les opé- 
rations arithmétiques ordinaires. On les notera X ; + ' X ; etc. Toutes ces 


opérations se définissent de façon semblable. Définissons par exemple + , 
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Soient a et b des nombres de E, . Considérons leur somme ordinaire 
« exacte » c = a + b. Si lcl < 1077, on pose a + b = 0. Dans ce cas, 


on dit que le résultat de l’addition est un zéro de machine. Si lci > 107, le 
résultat de l’opération n’est pas défini. On dit alors qu’il y a 
« dépassement ». Ainsi, l’opération + n’est pas toujours définie. (En algè- 


bre général, une opération de ce type est dite partielle, mais on n’introduira 
pas ce terme.) L’éventualité d’un dépassement doit être toujours prise en 
compte. 


Ensuite, si 10? < cl < 107, il existe dans E, , un nombre c consti- 
tuant une approximation de c, et l’on posera a + b = c. Autrement dit, la 


somme exacte est arrondie et est représentée en virgule flottante. Le nom- 
bre obtenu est considéré comme valeur approchée de la somme. La diffe- 


rence c — cest l'erreur d’arrondi apparaissant avec l’addition. 

La précision de la représentation des nombres en virgule flottante peut 
être caractérisée par le nombre appelé « £ de machine ». On le définit 
comme le plus petit nombre tel que 1 as € > 1. Voyons à titre d'exemple 


les opérations dans l’ensemble E, ,. En ajoutant à 0,1000: 10! le nombre 
0,5000: 1074, on obtient de nouveau 0,1000:10!, tandis qu’en ajoutant 
0,5001 - 10-#, on obtient déjà 0,1001 : 10!. 

Il faut remarquer que les opérations arithmétiques approchées +, X ; 


etc. possèdent des propriétés absolument différentes de celles des opéra- 
tions exactes. Par exemple, elles ne sont pas associatives, la loi de distribu- 
tivité ne joue pas, il existe des diviseurs de zéro, c’est-à-dire que le produit 
de facteurs non nuls peut devenir nul (on appelle cette situation 
« apparition de zéro de machine en multiplication »). 

Avec l’exécution d’un grand nombre d’opérations arithmétiques, les 
erreurs d’arrondi s’accumulent : le résultat peut différer considérablement 
de celui qu’on obtient par des opérations exactes. L’estimation d’erreurs 
engendrées (/’analyse directe d'erreurs d’arrondi) est une affaire compli- 
quée et laborieuse, vu la complexité des propriétés d’opérations arithméti- 
ques approchées. Dans certains cas, l’analyse directe d’erreurs d’arrondi 
peut être remplacée par les procédés utilisant le principe appelé analyse 
inverse d'erreurs d'arrondi. Selon ce principe, la solution approchée d’un 
problème quelconque, par exemple, d’un système d'équations linéaires, est 
la solution exacte d’un certain problème approché, à savoir, dans l’exemple 
donné, d’un système d'équations linéaires dont les coefficients sont quel- 
que peu modifiés. Au lieu d’estimer la différence entre la solution appro- 
chée et la solution exacte, on peut estimer la différence entre les coefficients 
du système initial et du système modifié. L’analyse inverse d’erreurs 
d’arrondi s'effectue de façon beaucoup plus simple que l’analyse directe. 
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Donnons un exemple type de problème où l’on peut se limiter à 
l'analyse inverse d’erreurs. Supposons que les coefficients du système 
d'équations linéaires ont été obtenus par des mesures physiques et par 
suite, nous sont connus avec une certaine erreur. Si par analyse inverse on 
montre que l’influence des erreurs d’arrondi est équivalente à une altéra- 
tion des coefficients, inférieure aux erreurs de mesure, on peut considérer 
que le calcul est suffisamment exact et ne pas prêter attention à la diffé- 
rence entre les solutions calculée et exacte du système, lui-même déterminé 
de façon insuffisamment précise. 

3. Influence de l’imprécision d’une information initiale. Si un problème 
pratique se réduit à un système d’équations linéaires, les coefficients et les 
termes constants du système sont en général connus avec quelques erreurs. 
En outre, comme il a été noté plus haut, la représentation des données ini- 
tiales et les calculs présentent des erreurs d’arrondi dont l'influence équi- 
vaut à une certaine altération des coefficients et des termes constants. 

On ne peut éviter les altérations mentionnées, mais on est en mesure 
d’estimer l'erreur obtenue et ensuite de choisir une telle méthode de résolu- 
tion du système qui n’augmente pas l’incertitude du résultat, déjà en germe 
dans le système même. 

La position adoptée sera la suivante : soit un système d’équations 
linéaires Ax = b qu’on appellera système initial ou non perturbé. On con- 
sidère encore un système, dit perturbé, dont on sait que les coefficients et 
les termes constants se trouvent dans les intervalles donnés | 


Ja, — Aa,,a, + Aa;f, ]b;, — Ab,, b, + Ab:f, 


où a;; et b, sont respectivement les coefficients et les termes constants du 
système initial. 

On appellera erreur de la solution la différence entre les solutions des 
systèmes initial et perturbé. (On admet que chacun des systèmes a une seule 
solution.) Selon cette définition, l’erreur est une matrice-colonne, de sorte 
qu’elle peut être estimée en une certaine norme de l’espace arithmétique. 
Dans les exemples de ce paragraphe, on étudie exclusivement la norme 
euclidienne. 

Considérons le plus simple des exemples. Soit un système de deux équa- 
tions linéaires à deux inconnues. Le système non perturbé est de la forme 

ax + by = 0, (1) 
aix + by = c.. 
Admettons que les coefficients affectant les variables sont exactes et ne 
sont perturbés que les termes constants, c’est-à-dire que Aa = Ab = 
= Aa, = Ab, = 0. 
Géométriquement, chaque équation du système non perturbé est repré- 
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Fig. 54. 


sentée par une droite du plan. L’équation correspondante du système per- 
turbé se représente alors par une droite qui lui est parallèle et qui est située 
à l’intérieur d’une bande (fig. 54). Pour la première équation, la bande est 
limitée par les droites 


ax + by = c — Ac et ax + by = c + Ac. 


Ainsi, les solutions du système perturbé sont situées à l’intérieur du parallé- 
logramme formé par l’intersection des bandes. 

L’erreur de la solution est représentée par le vecteur (Ax, Ay) dont la 
longueur peut atteindre la moitié de celle de la plus grande diagonale du 
parallélogramme. Par conséquent, l’influence due aux perturbations des 
termes constants du système est d’autant plus grande pour des bandes de 
même largeur que l’angle des droites (1) est plus petit. 

Dans le cas général où les coefficients du système perturbé diffèrent 
aussi de ceux du système initial, les droites représentant les équations subis- 
sent non seulement des translations mais encore des rotations. Le parallelo- 
gramme se remplace par une figure plus compliquée, mais le résultat géné- 
ral demeure le même : plus l’angle des droites (1) est petit, moins bien le 
système est conditionné, c’est-à-dire qu’avec la même perturbation des 
coefficients, l’erreur de la solution peut devenir plus grande. 

Notre objectif est de définir exactement et, si possible, de mesurer 
quantitativement la propriété d’un système d’équations linéaires d’être plus 
ou moins bien conditionné. 

On voit bien sur l’exemple considéré que si on remplace le système 
donné par un système équivalent, son conditionnement varie car dans ce 
cas le couple de droites (1) se remplace par un autre couple de droites ayant 
le même point d’intersection. On pourrait croire que le système le mieux 
conditionné est celui dont les droites représentatives sont perpendiculaires. 
Or une étude plus détaillée, tenant compte de la largeur des bandes, montre 
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qu’il n’en est pas toujours ainsi. Considérons par exemple le système 
1x = 1, 
10-3y = —107à. 


Une variation relativement petite des termes constants Ac, = 0, 
Ac, = 107*, pour laquelle 

lAcl _ V(Ac,} + (Ac,} _ 10-3 

Ici Ve? + ci 


aboutit à l'erreur de solution égale à (0, 1) et à l’erreur relative 


IAxh _ V(Aax} + (AyP 


RE RS 


lxh Var? + y? 


On remarque facilement que le mauvais conditionnement de ce système est 
dû au fait que ses coefficients et termes constants sont de grandeur diffé- 
rente. La situation peut être améliorée par multiplication de la seconde 
équation par 10. 

Examinons la question dans une autre optique. Le système d’équations 
linéaires peut être interprété d’une façon différente, comme un problème 
qui consiste à rechercher un antécédent du point C'(c, + Ac,,c, + Ac,) 
dans la transformation affine du plan 


ax + by, 
a,x + by. 


x* 
y* 
Supposons que la transformation affine est connue de façon exacte : 
Aa = Aa, = Ab = Ab, = 0. Quant au point C”, on sait seulement qu’il 
se trouve à l’intérieur d’un cercle de rayon bp et de centre C(c,, c;). L’anté- 
cédent du cercle est l’ellipse et, par suite, la solution du système perturbé se 
trouve à l’intérieur d’une ellipse. Le centre de cette ellipse est l’antécédent 
du centre du cercle, c’est-à-dire la solution du système non perturbé. 
Dans une transformation affine, les antécédents de tous les cercles ont 
un même rapport des demi-axes. Soient Ào et up (À > u) les demi-axes de 
l’antécédent d’un cercle de rayon p. Dans ce cas, la longueur à du vecteur 
erreur (Ax, Ay) ne dépasse pas À. 
Pour estimer l’erreur relative, minorons la longueur du vecteur repré- 
sentant la solution du système non perturbé. Etant donné que le point C'se 


trouve sur le cercle de rayon r = Vc? + ci et de centre à l’origine des 
coordonnées, son antécédent est un point de coordonnées (x,, y,) dont la 
distance à l’origine des coordonnées est au moins égale à ur. Donc, 


d = Vx£ + y > ur, et pour l'erreur relative de la solution on obtient 


(2) 
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l'estimation 


— < 


Ô À p 
Aer (3) 


“ 


p/r est ici l’erreur relative maximale de la matrice-colonne des termes cons- 
tants. 

Ainsi donc, le rapport des demi-axes de l’ellipse À/u peut être interprété 
comme le nombre caractérisant le conditionnement du système (1). 

On voit ici en particulier qu’un mauvais conditionnement du système 
est indépendant de la valeur du déterminant : il dépend du rapport des 
demi-axes de l’ellipse ; quant au déterminant, il est égal au rapport des 
aires du cercle et de l’ellipse et n’est en aucune façon lié à la forme de 
l’ellipse. 

4. Matrices quasi singulières. La perturbation des coefficients d’un 
système d'équations linéaires peut non seulement altérer quelque peu sa 
solution mais avoir aussi des conséquences plus sérieuses. Le système 
d'équations linéaires 


x + 0,99y 
x + 1,017 


1,01, 
0,99 


a une solution unique, mais une variation de 1 % de ses coefficients et 
seconds membres peut aboutir soit à un système incompatible, soit à un 
système admettant une infinité de solutions. 

Dans l'exemple donné, le déterminant de la matrice du système est petit 
devant ses coefficients. Il n’est pas toutefois difficile de fournir un exemple 
de matrice dont le déterminant n’est pas du tout petit, mais qui s’annule 
après une petite perturbation des éléments de la matrice. Considérons par 
exemple une matrice diagonale, disons d’ordre douze, où tous les éléments 
diagonaux sont égaux à dix, à l'exception du dernier qui est égal à 10-10. 
Le déterminant d’une telle matrice est 10, mais peut devenir nul si on varie 
un seul élément de 10-10. 

La raison de ce fait est la suivante. Considérons les éléments de la 
matrice comme des variables indépendantes. Le déterminant est une fonc- 
tion linéaire de chacune de ces variables, le coefficient de la variable œ;; 
étant le cofacteur de cet élément. Quelques mineurs d’ordre 7 — 1 peuvent 
s’avérer grands par rapport au déterminant. Dans ce cas une petite varia- 
tion d’un élément peut entraîner l’annulation du déterminant. Cette ques- 
tion sera traitée en détail au $ 2. 

Pour l'instant, il nous faut souligner l’importance de principe de ce 
phénomène. Si les nombres ne peuvent être définis exactement, la frontière 
entre les matrices singulières et régulières cesse d’être nette et il apparaît 
une classe de matrices quasi singulières dont les frontières dépendent du 
degré de précision adoptée dans l’étude concrète. À propos de la matrice 
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quasi singulière, on ne peut dire si elle est singulière ou régulière, car en 
variant ses éléments dans les limites de précision adoptée, on peut obtenir 
soit une matrice singulière, soit une matrice régulière. Aussi dans les calculs 
approchés faut-il faire attention aux expressions du genre « admettons que 
la matrice À est régulière. » dont abonde le cours d’algèbre linéaire. 

Si dans un système d’équations linéaires la matrice s’est avérée quasi 
singulière, il vaut mieux revenir au problème qui a conduit au système 
d'équations linéaires considéré et obtenir une information complémentaire 
sur ce système. Il peut arriver par exemple que d’après la situation envisa- 
gée dans le problème la solution doit être unique. Une certaine approche de 
ce qu’on doit considérer dans ce cas comme solution du problème sera dis- 
cuté au chapitre XIV, mais ce n’est qu’une des possibilités. En réalité, il 
faut se représenter de façon nette qu’une indétermination quantitative dans 
l'information initiale exerce dans ce cas une influence qualitative sur la 
solution, et il serait plus correcte de concentrer les efforts non pas sur la 
résolution du système mais sur la position plus rigoureuse du problème. 

Il n’est pas difficile de remarquer que l’apparition de la classe des 
matrices quasi singulières est plus en rapport avec la nature des calculs 
approchés qu'avec les propriétés du déterminant, envisagé comme fonction 
de matrice. Vu que cette fonction est continue, l’ensemble des matrices 
régulières est ouvert (voir Koudriavtsev [21], t. 1, p. 329). Cela signifie que 
pour toute matrice régulière À, il existe un voisinage A — A,l < € com- 
posé de matrices régulières. Or, on ne peut considérer des voisinages aussi 
petits que l’on veut, car le rayon du voisinage ne peut être inférieur à un 
certain nombre €, défini par la précision des calculs ou par la valeur de 
l’éventuelle perturbation de la matrice. La matrice quasi singulière est la 
matrice dont le voisinage de rayon €, contient une matrice singulière. 

Ces considérations de nature assez générale montrent que le long de la 
frontière de tout ensemble ouvert apparaît une « bande d’indétermina- 
tion » de largeur €, composée de &,-voisinages des points frontières de 
l’ensemble &. Au-delà de cette bande, l’appartenance à l’ensemble peut 
être vérifiée numériquement. Au contraire, l'appartenance à la frontière de 
ne peut pas être vérifiée numériquement : un tout petit écart fait passer 
d’un point frontière à un point de l’ensemble. 

Si l’on tient compte des erreurs d’arrondi et des perturbations, on voit 
devenir moins nettes les frontières des ensembles tels que l’ensemble des 
matrices de rang fixé, celui des matrices de structure simple (c’est-à-dire des 
matrices dont le polynôme minimal ne possède pas de racines multiples). 
On voit aussi devenir moins nette la notion de système libre de vecteurs, et 
beaucoup d’autres choses. 

On pourrait dire que l’algèbre linéaire joue par rapport à tout ceci le 
même rôle de modèle abstrait que la géométrie euclidienne pour le dessin 
technique. 
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S. Capacité limitée de la mémoire. La source des difficultés liées aux 
erreurs d’arrondi est le nombre fini de chiffres significatifs qu’on utilise 
pour noter un nombre. Dans la pratique de résolution des systèmes d’équa- 
tions linéaires, il existe encore une source de difficultés, de nature à pre- 
mière vue quantitative, mais qui est en fait d’une importance de principe. I] 
s’agit de la capacité de la mémoire de l’ordinateur, qui limite les dimen- 
sions (c’est-à-dire le nombre d'équations et de variables) des systèmes à 
résoudre. Il est vrai que la capacité des mémoires externes est si grande 
qu’elle n’impose pas de sensibles limitations, mais l’utilisation de ces dispo- 
sitifs est liée à d’autres difficultés, en premier lieu à un temps d’accès beau- 
coup plus grand. 

Le lecteur non initié à la programmation pourrait le plus simplement se 
représenter la situation ainsi. Vous résolvez un système d’équations linéai- 
res au tableau noir. Ce dernier est couvert de quadrillage dont chaque case 
peut contenir un nombre. Une fois le tableau couvert de nombres, on ne 
peut y continuer d'écrire qu’en effaçant quelque chose. Il y a encore un 
cahier, mais il faut du temps pour aller le chercher, d’ailleurs on ne peut 
recopier du tableau sur le cahier ou inversement qu’un nombre entier de 
pages. Il est évident que résoudre dans ces conditions un système dont la 
matrice ne se case pas sur le tableau ou le remplit presque en entier exige 
une certaine ingéniosité et un temps supplémentaire. 

Bien que la capacité des mémoires et la vitesse de fonctionnement des 
ordinateurs nouvellement créés augmentent rapidement, les besoins de la 
pratique s’accroissent encore plus vite. Aussi la résolution de systèmes 
d’équations un peu trop grands pour un ordinateur donné est-il toujours 
un problème d’actualite. 

Il va de soi que dans la réalisation de tout algorithme, on attache beau- 
coup d’attention à l’économie de place dans la mémoire vive mais, une fois 
sa capacité fixée, il existe assurément un ordre maximal de systèmes 
d'équations linéaires de forme générale qu’on est en mesure de résoudre 
sans recourir trop souvent aux mémoires externes. La résolution des systè- 
mes d’ordre plus grand s’avère possible sous des conditions supplémentai- 
res qui permettent d’utiliser des méthodes de résolution spéciales. 

Il existe les classes principales suivantes des matrices dont le stockage 
exige moins de place que celui des matrices de même ordre et de forme 
générale. : 

a) Matrices calculables. Supposons que les éléments de la matrice peu- 
vent être facilement calculés d’après des données initiales quelconques 
occupant relativement peu de place. Dans ce cas, au lieu de mémoriser les 
éléments de la matrice, on peut chaque fois les calculer. Cela accroît évi- 
demment le temps de calcul, mais souvent ce subterfuge s’avère payant. . 

b) Marrices creuses. On appelle ainsi les matrices dont la plupart des 
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éléments sont nuls et dont les éléments non nuls se disposent d’une façon 
quelconque. On peut mémoriser seulement les éléments non nuls de la 
matrice creuse, mais il faudra dépenser un temps supplémentaire et une 
partie de la mémoire pour indiquer dans quelle ligne et quelle colonne se 
trouve l’éléments non nul donné. 

Le schéma le plus simple consistera par exemple à mémoriser un élé- 
ment de la matrice avec les numéros de ses ligne et colonne. Si on le fait de 
la façon la plus simple mais non pas la plus économe en réservant une cel- 
lule au stockage d’un numéro, le nombre total de cellules nécessaires s’avé- 
rera trois fois plus grand que celui d’éléments non nuls. Si, de plus, la 
matrice n’est remplie qu’à 1/5, il n’est pas encore clair si l’économie réali- 
sée vaut les dépenses de temps et la complication du programme. Pratique- 
ment, une matrice de grande dimension mérite d’être considérée creuse si le 
nombre d’éléments non nuls est de même ordre que le nombre de lignes 
dans la matrice. 

Les matrices creuses apparaissent dans nombre de problèmes des 
mathématiques appliquées. La description du mode de stockage et de trai- 
tement de ces matrices peut être trouvée dans le livre de Twearson [37]. 

c) Une position intermédiaire entre les deux classes de matrices décrites 
plus haut est occupée par les matrices qu’on peut appeler matrices de for- 
mes spéciales. Leurs éléments nuls ont des places connues d'avance, ou 
bien une partie de leurs éléments se calcule d’après les éléments mémorisés. 
Viennent à l'esprit, par exemple, les matrices diagonales, symétriques ou 
triangulaires. 

Parmi les matrices de formes spéciales, non rencontrées encore, il faut 
nommer les matrices en bande. La matrice À est dite en bande si ses élé- 
ments sont tels que a, = 0 pour li — jl > k, où k est un nombre fixé. 
Cela signifie que ne peuvent être différents de zéro que les éléments de la 
matrice qui sont situés à l’intérieur de la bande de largeur 24 + 1, orientée 
le long de la diagonale principale. 

Les matrices en bande se rencontrent dans les diverses applications. La 
raison en est la suivante. Supposons qu’un système d’équations décrit des 
liaisons existant entre les parties composantes d’un objet réel. Si le nombre 
des parties composantes est grand, il est naturel que toutes les parties ne 
sont pas liées les unes aux autres de façon directe. Si sont directement liées 
les seules parties dont les numéros diffèrent de & au plus, la matrice des liaiï- 
sons sera une matrice en bande. 

Pour les matrices de formes spéciales les plus fréquentes, on a mis au 
point des modifications de la plupart des algorithmes connus ainsi que des 
algorithmes spéciaux permettant d'utiliser ces matrices. C’est ainsi qu'il 
existe des algorithmes permettant de résoudre les systèmes d’équations 
linéaires dont les matrices sont symétriques ou en bande, et de trouver les 


384 INTRODUCTION AUX MÉTHODES NUMÉRIQUES [CH.XHI 


valeurs propres et les vecteurs propres des transformations définies par de 
telles matrices. Ces algorithmes fonctionnent de façon plus efficace et per- 
mettent de résoudre des problèmes de dimension plus grande grâce à la 
forme spéciale de ces matrices. On n’étudiera pas ces algorithmes. 

Le choix de la méthode de résolution d’un système d’équations linéaires 
et, en général, de tout problème concernant les matrices, dépend de façon 
essentielle du mode de stockage des matrices. Les méthodes, telle la 
méthode de Gauss, conviennent pour des matrices de forme générale, pas 
trop grandes. Pour des matrices encombrantes dont le stockage utilise leurs 
propriétés particulières, les méthodes de résolution des systèmes d’équa- 
tions, basées sur les transformations de la matrice du système, sont d’une 
application peu commode. Au cours des transformations, la matrice creuse 
risque de perdre sa propriété si des mesures spéciales ne sont pas prises. De 
même, si les éléments d’une matrice se calculent d’après les formules sim- 
ples, les éléments de la matrice transformée ne sont plus, en général, munis 
de cette propriété. Aussi pour résoudre les systèmes d’équations linéaires 
dont les matrices sont assez grandes recourt-on à des méthodes spéciales, 
par exemple aux méthodes itératives, étudiées au $ 4. 


$ 2. Conditionnement 


1. Majoration de la perturbation. Soit donné le système d’équations 
linéaires initial 

Ax = b, (1) 

où À est une matrice carrée d’ordre net det À # 0. Considérons le système 


perturbé 
(A + ÔA)y = b + Ôb. (2) 


Il n’est d’abord pas clair si le système (2) aura une solution unique comme 
le système (1). On en imposera plus bas à ô4 une condition suffisante. 
Notre objectif immédiat est d’estimer, sous cette condition, la norme de la 
différence entre les solutions des deux systèmes. 

Dans le présent paragraphe, on entend par norme matricielle la norme 
qui possède la propriété annulaire et qui est compatible avec la norme sur 
l'espace des matrices-colonnes. 


PROPOSITION 1. Supposons que pour une norme matricielle la matrice 
carrée B satisfait à la condition | BA < po < 1. Il existe alors une matrice 
(E + B)-! telle que I(E + B)='1 < (1 — o)”!. 


DÉMONSTRATION “). La majoration du rayon spectral de la matrice (pro- 


*) On utilise dans la démonstration les résultats du ch. XII. Le lecteur qui n’a pas étudié 
ce chapitre peut adopter la proposition 1 sans démonstration. 
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position 1, $ 4, ch. XII) entraîne que toutes les valeurs propres de la 
matrice B se trouvent à l’intérieur du disque XI < », c’est-à-dire à l’inté- 
rieur du disque de convergence de la série entière en À de la fonction 
(1 + À)” !. Cela garantit l’existence de la matrice (E + B)-! égale à la 
somme de la série E — B + B? -,.…. 

Pour la somme partielle de cette série on a, selon la relation (12) du $ 3, 
ch. XI, la majoration 


k k 
IS 1 < IBkI < ugié < -1_ 
k l = p 
0 0 


D'où, en passant à la limite pour # — œ, on obtient l’inégalité exigée. 

Majorons maintenant la norme de la perturbation de la solution, c’est- 
à-dire lôx! = y — xl, où y est la solution du système (2) et x, du système 
(1). Retranchons pour cela (1) de (2). Il vient 


(A + 6A)(x + ôx) — Ax = 6b, 


ou 
(A + 6A)ôx + Ô Ax = 6b. (3) 
Ecrivons À + 6.A sous forme de A(E + A-'64) et supposons que 
NA -1N-N6 AU = o < 1. (4) 


Alors 14-16 AÏ < p et, selon la proposition 1, la matrice E + A-!54 
possède une inverse. Donc, 


(A + 64)! =(E + 4-!164)-1A4-1, 
et il découle de (3) que 
ôx = (E + A=164)-!4-16b — (E + A-164)-!'A-16Ax, 
d’où 
l 
Er 


lôxt <—— 14-11-1661 — IA IS AN A. 
— P 


Il ressort de l’égalité (1) que Ib < HAÏ-Ixl. Renforçons l’inégalité en 
multipliant le premier terme du second membre par 1 AÏ-Axll/Ibh. Alors, 
lôxl < C(A)lxl 1651 c(A)lxl BAL 

1 — po bi 1 — p HAÏ 
où 
c(A) = LA='R-1AN. (5) 


25—6442 
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Divisons par Ixi et tenons compte de ce que 


16AI 
= 1641-14 -II = c(4) -——. 
FRAME A) 
On obtient la majoration définitive 
lôxi c(A) ee l5bA ) 
Tr CE ee R 
Exch 1 — c(4) I6AN \ RAÏ Ib 
lAI 


Le nombre c(À) introduit par la formule (5) est appelé nombre condi- 
tionnel de la matrice À en norme considérée. 
On peut maintenant formuler le résultat suivant. 


PROPOSITION 2. Supposons que la matrice des coefficients et la matrice- 
colonne des seconds membres du système (1) ont subi les perturbations à À 
et ôb, et que de plus WA=!'1-16AÏ < 1 en une norme matricielle. Le 
système perturbé possède alors une solution unique, et la perturbation rela- 
tive 1lôxl/Ixl de ja solution du système (1) est majorée au moyen des per- 
turbations relatives à = WG AU/LAN er B = 15bN/ADÜ de la matrice du 
système et de la matrice-colonne des seconds membres par la formule 


Nôxl _ c(AXa + 8) 
Ext 1 — c(A}a ” 


où c(A) est le nombre conditionnel de la matrice À en norme considérée. 


(6) 


Il est remarquable que le second membre de (6) ne contient que les per- 
turbations relatives de À et b. La matrice À n’est représentée que par son 
nombre conditionnel, quant à la matrice-colonne b, elle n’y figure pas du 
tout. 

2. Nombre conditionnel. Selon la proposition 2, plus le nombre condi- 
tionnel est grand, plus la perturbation relative de la solution est grande 
pour les mêmes perturbations relatives des données initiales. Le nombre 
conditionnel est déterminé non seulement par la matrice, mais également 
par le choix de la norme. Pour des normes différentes, la formule (6) don- 
nera des majorations différentes, plus ou moins précises de la perturbation 
relative. Dans ce point, on examinera le calcul du nombre conditionnel de 
la matrice et déduira quelques-unes de ses propriétés. 

Commençons par les relations simples suivantes qui sont vérifiées pour 
toute norme. Il découle immédiatement de la définition que 


c(A) = c(A7!). (7) 


En multipliant les inégalités LAB < HWAR-IBI et 1(AB)-'Ù = 
= IB-'A-!1 < IB-'1-1A -!1, on obtient 


c(4B) < c(A)c(B). (8) 


Ensuite, à partir de À -!4 = Eonac(A) > HEÏ. Vu que LEÏ > 1 (voir 
(11), $ 3, ch. XI), on obtient 


c(A) > NE > 1. (9) 


Soient æ, et a, le plus grand et le plus petit nombre singulier de la 
matrice À. Selon la proposition 14 du $ 3, ch. XI, on a pour la norme spec- 
trale LAÏ = a, et, suivant la formule (16) du $ 3, ch. XI, LA 1 = a !. 
Donc, le nombre conditionnel en norme spectrale (ou, comme on dit, ñnom- 
bre conditionnel spectral) est obtenu par la formule 

c(A) = (10) 
“œ, 

Au $ 1 on a obtenu à partir des considérations géométriques que le con- 
ditionnement du système de deux équations à deux inconnues est caracté- 
risé par le rapport des demi-axes d’une ellipse (l’antécédent du cercle par 
transformation linéaire définie par la matrice du système). En se rappelant 
la signification géométrique des nombres singuliers et la formule (10), on 
remarque que ce rapport est justement le nombre conditionnel spectral. 

Il ressort immédiatement de (10) que pour la matrice orthogonale (ainsi 
que pour la matrice unitaire) le nombre conditionnel spectral est 1. 

De la propriété correspondante de la norme spectrale (proposition 13, 
$ 3, ch. XI) il découle que le nombre conditionnel spectral c(4) ne varie 
pas quand on multiplie À par la matrice orthogonale (resp. unitaire). En 
vertu de ce fait, en résolvant les systèmes d’équations linéaires, il est préfé- 
rable de multiplier la matrice du système par des matrices orthogonales. 

Considérons maintenant les inégalités entre les nombres conditionnels 
associés aux normes différentes. Si deux normes # et ÿ sont telles que pour 
toute matrice À on a #(4) < BY(4A), les nombres conditionnels corres- 
pondants sont liés, comme on le voit facilement, par l’inégalité 


2 
C, < B Cy- 
La norme euclidienne de la matrice est égale à la racine carrée de la 


somme des carrés de ses nombres singuliers, quant à la norme spectrale, 
elle est égale au nombre singulier maximal. Aussi de l’inégalité 


VnlAÏ et, par suite, 


s’ensuit-il que RAR < AN, < 
) < Ck(A) < nc(A). (11) 


c(A 
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D'une façon analogue, à partir de 


1.) 


2 2 2 2 
max la; < y la;;l < n? max la;;l 
y] 


on obtient les inégalités pour la norme 14. = n max la l et la norme 
4 J 


euclidienne 


JL IA. < LAN, < VAL, 
n 


et, à partir de ces dernières, les estimations pour les nombres conditionnels 


Le. < C < Ce. (12) 

Il n’existe pas pour le calcul de c_. de formules satisfaisantes, commo- 
des pour des études théoriques, mais pour une matrice concrète ce nombre 
peut être aisément calculé si est connue la matrice inverse. Par contre, pour 
le nombre conditionnel spectral il existe une formule générale satisfaisante 
qui est toutefois difficilement calculable pour une matrice concrète de 
forme générale. 

L'application pratique des nombres conditionnels pour estimer l’erreur 
au cours de la résolution d’un système concret est rendue difficile par le fait 
qu’en résolvant le système on ne calcule pas la matrice inverse, de sorte que 
le nombre conditionnel ne peut être obtenu qu’au bout d’efforts relative- 
ment grands. 

3. Matrices quasi singulières. On dit qu’une matrice est quasi singulière 
si par une petite variation de ses éléments elle peut être transformée en une 
matrice singulière. Ceci étant, la classe des matrices quasi singulières est 
fonction de l’ordre de petitesse adopté pour les éléments. L'exemple de la 
p. 380 montre que la petitesse du déterminant n’est pas une condition 
nécessaire pour que la matrice soit quasi singulière. Cette condition n’est 


. 1 : 
non plus suffisante, comme le montre l’exemple de la matrice = E, où E est 


la matrice unité, disons d'ordre 20. On montrera plus loin le lien entre la 
propriété de la matrice d’être quasi singulière, la norme de sa matrice 
inverse et le nombre conditionnel. 

Soit une matrice À. Décomposons son déterminant suivant la s-ième 
ligne 


det À = (—1)*/a,.Mi + N, 


où N'est la somme des termes qui ne contiennent pas l'élément a. L’addi- 
tion de €;; à l'élément a; pour annuler le déterminant doit vérifier l’équa- 
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tion 
(— D'#/(a; + €; ;)M: + N = O0, 


ou . . . 
(— 1)'*/Me, = —det A. 


Si M; = 0, il est évident que det À ne varie pas avec la modification de a;; 
Dans le cas contraire, on obtient 
. .. det À 
= — It = (bb .)71 
J 
désigne un élément de la matrice inverse À 
M : s’intéressera à la perturbation minimale en un d’un élément de 
la matrice, qui annule le déterminant. On a pour cette perturbation 
d = _ 
E = min le;;l _ (max lb!) À 
Le minimum est ici pris suivant i, j pour lesquels M # 0. Mais le maxi- 
mum peut être pris suivant tous les #, j, car pour M: = Oona b;, = 0.Eny 


| : D 
portant max lb;;l = — 14-1h. qui figure dans la définition de la norme 
n 


+11 ., on obtient 
e = nlATNT I. 


Supposons que le minimum est atteint pour la k-ième ligne et la /-ième 
colonne. Notons E,, la matrice dont tous les éléments sont nuls, sauf l’élé- 
ment e,, = 1. Alors, det (4 + £&E,,) = 0 et la norme de la perturbation 
£E,, vaut 


n? 


IE le. =ne = ————. 
se lA 14. 


On a étudié ici un cas particulier quand ne varie qu’un élément de la 
matrice. Dans le cas général, le déterminant s’annule pour des perturba- 
tions de norme inférieure. On peut toutefois énoncer la proposition sui- 
vante. 


PROPOSITION 3. Le déterminant de la matrice À peut être annulé par 
adjonction d’une matrice dont la norme ne dépasse pas n°l\A | 2e 


Remarquons que l'estimation de la perturbation relative de la matrice À 


contient le nombre conditionnel : 
2 
leE,,l -_ _n 
lAN.. c..(À) 


En rapport avec la proposition 3, il faut rappeler la condition (4) selon 
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laquelle la perturbation &A satisfaisant à la condition A8 A1 < pofA4-!l-1, 
où p < 1, ne peut annuler le déterminant de A. 

Ainsi donc, la perturbation nécessaire pour annuler le déterminant est 
égale en norme à «ll A 11 =, où 1 < x < n°, ce qui monte que le nombre 
LA - 111 peut servir à dire dans quelle mesure la matrice À est proche 
d’une matrice singulière. 

Si 1 * Il est la norme sur l’espace arithmétique, la fonction 


A) = inf 
8 gro DEN 

est égale, selon la proposition 12 du $ 3, ch. XI, à zéro pour les matrices 
singulières et à 14 -!Ï-! (au cas de norme induite) pour À régulière. En 
particulier, si la norme Il * Ï| est euclidienne, on a 


14-111 = 


où à, est le nombre singulier minimal de la matrice À (formule (16), $ 3, 
ch. XI) et par suite, le nombre singulier minimal peut servir de mesure de 
proximité de la matrice À à une matrice singulière. Cette conclusion peut 
s’appuyer aussi sur les raisonnements suivants. Le théorème 1m du $ 1, ch. 
XI, montre que pour la matrice À il existe des matrices orthogonales S et P 
telles que À” = SAP est une matrice diagonale ayant les nombres singu- 
liers sur la diagonale principale. La matrice À ” peut être rendue singulière 
par une perturbation de norme égale au nombre singulier minimal œ,. Soit 
det (4° + F°) = 0. Alors 


det (4° + F7) = det S det P det (A — S-IF°"P-1) = 0, 


et, par suite, À peut être rendue singulière par l’adjonction de la matrice 
F = S-'F'P-1\. Or la multiplication par une matrice orthogonale ne 
modifie pas la norme spectrale. Donc, F1 = «,. 

On voit que la matrice À peut être rendue singulière par une perturba- 
tion de norme égale à &, . La perturbation relative correspondante est égale 
en norme à 


LA 
DAU  HALIA-N 


Il en découle la proposition suivante. 


PROPOSITION 4. La matrice À peut être rendue singulière par une pertur- 
bation relative de norme égale à [c(A)]”!, où c(A) est le nombre condi- 
tionnel spectral de À. 

Etudions en détail l’influence de la perturbation sur la solution du 
système d’équations linéaires à matrice quasi singulière. 

Une matrice carrée À peut être décomposée suivant le théorème 1m du 


$ 2] CONDITIONNEMENT 391 


$ 1, ch. XI, en produit À = PDQ, dans lequel P et Q sont des matrices 
orthogonales et D une matrice diagonale avec nombres singuliers de la 
matrice À sur la diagonale. Considérons le système d’équations perturbé 


(A + ÔA)(x + ôx) = b + 6b, 


et portons-y la décomposition indiquée de 4. Alors 
(PDQ + P'PÜA'OQO)(x + ôx) = b + 6b, 


d’où 
(D + FX(y + ôy) = c + ôc, 


où 
F = 'P5A'Q, y = Ox, ôy = Qôx, c = ‘Pb, ôc = ‘Pôb. 


Notons que pour la norme spectrale ou euclidienne on a IF1 = [6 A. 
Admettons que cette norme est petite ou qu’on a au moins Iô A - A -!1 = 
= IA-ID-' < 1.1! vient 


D(1 + D-'F\(y + ôy) = c + ôc, 
py+ôpy=(1- D''F +...)D !'(c + ôc). 


Si l’on néglige les carrés des perturbations, on obtient en utilisant 
y = Drl'c que 


ôy = —-D-'FD-! + D-!lôc. 


La matrice D-!FD-! s'obtient de F par division de toutes ses lignes et 
colonnes par les nombres singuliers correspondants. Ceci étant, les élé- 
ments diagonaux se divisent par les carrés des nombres singuliers. Le der- 
nier terme est obtenu par division des composantes de ôc par les nombres 
singuliers correspondants. 

Si la matrice À est quasi singulière et mal conditionnée, quelques-uns de 
ses nombres singuliers (au moins @, ) sont petits, tandis que les autres (œ, en 
tout cas) ne peuvent être considérés comme petits. La dernière composante 
de ôy est de la forme 


ÿ Jui & Jan Cn + ‘cs 
a, o œ, 
jet 7 
Si l’on admet que J; sont comparables en grandeur avec a,, le terme 
fc, /où dépassera en module tous les autres termes ainsi que es autres 
composantes qui ne contiennent que le terme f, c, /a;,a, 
Il va de soi que si quelques autres nombres singuliers de la matrice À 
s’avèrent aussi petits, le résultat obtenu sera également vrai pour les com- 


posantes de l’erreur ôy qui leur sont associées. 
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On a posé ôy = Qôx. Les colonnes de la matrice Q constituent la 
seconde base singulière de la matrice À ou, ce qui revient au même, la pre- 
mière base singulière de la matrice À - ! (proposition 14, $ 1, ch. XI). Aussi 
l’estimation assez grossière faite plus haut permet-elle de justifier la propo- 
sition suivante. 


PROPOSITION 5. Supposons que les nombres singuliers de la matrice A 
sont rangés en deux groupes dont l’un contient tous les nombres proches de 
zéro et l'autre, ceux qui en sont loin. Dans ce cas, l'erreur de la solution du 
système d'équations linéaires à matrice À est due aux composantes de À 
suivant les vecteurs de la première base singulière de la matrice À 7}, qui 
correspondent aux grands nombres singuliers de la matrice À -\. 


L'interprétation géométrique de cette proposition peut être obtenue à 
l’aide de l’exemple étudié au $ 1. Le vecteur de la première base singulière 
de la matrice À - !, correspondant au plus grand nombre singulier est diri- 
gée le long du plus grand axe de l’ellipse construite. 

On peut de même fournir l’explication intuitive suivante de ce résultat. 
Si la matrice régulière À tend vers la matrice singulière À, certains de ses 
nombres singuliers tendent vers zéro. Les vecteurs correspondants de la 
seconde base singulière de À tendent alors vers les vecteurs qui engendrent 
le sous-espace des solutions du système d'équations homogènes 4w = 0. 

Si £ est solution du système A = b, toute matrice-colonne £ + #, où 
Az = 0, est une solution de ce système, c’est-à-dire que la solution est 
définie à l’« erreur » près vérifiant le système homogène. 

Terminons l’etude des matrices quasi singulières par une remarque par- 
ticulière qui sera utile à l’expose ultérieur. Pour une matrice symétrique, les 
modules des nombres caractéristiques sont des nombres singuliers, de sorte 
que si æ, et a, sont le plus grand et le plus petit nombre singulier de la 
matrice À, le plus grand et le plus petit nombre singulier de la matrice ‘4 A 
seront æ et a. Cela signifie que pour le nombre conditionnel spectral on a 


c('AA) = [c(A4)F. (13) 


En outre, il peut arriver que pour un «, assez élevé, «= acquiert un ordre 
comparable à celui des erreurs et, par suite, la matrice ‘AA sera quasi sin- 
gulière, bien que À ne le soit pas. 

4. Conditionnement du problème de recherche des vecteurs propres et 
des valeurs propres. Soit la transformation linéaire À définie dans une cer- 
taine base par la matrice 4. On s'intéresse aux valeurs propres et aux vec- 
teurs propres de cette transformation. Supposons qu’il nous soit donné, au 
lieu de la matrice À, la matrice perturbée À + 64. Il existe plusieurs résul- 
tats qui aident à estimer la perturbation des vecteurs propres et des valeurs 
propres, engendrée par la perturbation 4. On étudiera certains d’entre 
eux. 
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Admettons que la transformation À est définie par une matrice de 
structure simple. En vertu de cette hypothèse, il existe une matrice S telle 
que D = S-!'AS est une matrice diagonale : 


D = diag (À,, .…, À,). 
Dans ce cas, 
S-1(4 + 6A)S = D + S-'5AS. 
Supposons que À* est une valeur propre perturbée, c’est-à-dire qu’il existe 


une matrice-colonne £* # O0 telle que (À + 64)£* = X*£*. Cela signifie 
que 


(D + S-'5AS)#* = X°#*, 
où g* = S-'£*, ou 
(D — X'E)w* = —-(S-'5AS)#"*. 


On a 
ID MET D inf 1(D — AE)el = min IX — M1 
lg*i ÊTES 
et 
CE < sup I(S-1545)al = 1S-'6ASI < 15Alc(S), 


où c(S) est le nombre conditionnel spectral de la matrice S. Donc 
min IX, — À*I < 15 AÏc(S). 


{ 
La matrice S est évidemment définie d’une façon moins restrictive. Consi- 
dérons le nombre 


y(A) = inf c(S) 


qui est la borne inférieure des nombres conditionnels de toutes les matrices 
diagonalisant À. Il est évident que cette borne inférieure existe et 
y(A) > 1. On peut maintenant écrire 


min [À — ÀA*I < »(A)IGAÏ. (14) 


ProPosiTion 6. La valeur propre perturbée X* appartient à l’un au 
moins des disques du plan complexe de centres aux points X, et de rayon 
y(A 6, où à est la norme spectrale de la perturbation de la matrice. 


On peut montrer, comme pour les disques de localisation, que la réu- 
nion de m disques (14) contient exactement m valeurs propres perturbées. 
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Ceci étant, il faut tenir compte des multiplicités des valeurs propres pertur- 
bées et non perturbées. 

Ainsi donc, le conditionnement du problème de recherche des valeurs 
propres peut, à certain égard, être décrit par le nombre (4). Les colonnes 
de la matrice S peuvent être considérées comme normées. Un grand nom- 
bre conditionnel signifiera dans ce cas que les colonnes de S sont proches 
des colonnes linéairement dépendantes. Donc, un »(4) grand montre que 
À n’a pas de bonne base des vecteurs propres « suffisamment linéairement 
indépendants ». 

Toutefois, on ne peut se limiter à un seul nombre conditionnel dans le 
problème de recherche des valeurs propres, car la situation est ici plus com- 
pliquée que dans le cas de résolution d’un système d’équations linéaires. 
Plus précisément, les valeurs propres différentes ne sont pas également sen- 
sibles aux perturbations de la matrice. 

Soitx= Îx,,.…,x, Îl une base de vecteurs propres de la transformation 
À. Supposons que les vecteurs sont normés : Ix.Ï = 1 (on choisit la norme 
euclidienne en admettant que l’espace est euclidien). On sait de la proposi- 
tion 10 du $ 1, ch. XI, que la base biorthogonale à la base x est composée 
des vecteurs propres de la transformation adjointe A* de À. Normons les 
vecteurs de cette base et notons les vecteurs normés y,, ..…., y, . 

Soient £; et #; les colonnes de coordonnées des vecteurs x; et y,, i = 
= 1, .…, n, dans une base orthonormée e. Dans ce cas, AË£; = X£;, 
‘Ag = À;#,, où ce qui revient au même ‘#4 = À;'#; et, de plus, 


"a,ë; = [° ru 
1 ss #0, i= j. 


Considérons le vecteur propre x* et la valeur propre À* d’une transfor- 
mation dont la matrice est perturbée. La colonne de coordonnées £* du 
vecteur x* vérifie l’égalité 


(A + OA)E* = À°E*. (15) 


Soit À. la valeur propre de A la plus proche de X* (ou l’une des plus proches 
si elles sont équidistantes de X*). Désignons À* — À, par ôX,. Pour une 
transformation de structure simple, l’espace se décompose en somme 
directe de sous-espaces propres. Cette décomposition définit la projection 
de x* sur le sous-espace propre correspondant à À. Désignons cette projec- 
tion par x, et x* — x; par Ôx;. En cas de besoin, en multipliant x* par un 
facteur numérique, on peut considérer que Ix; = 1 et inclure x; dans la 
base. Ecrivons (15) par l'intermédiaire des perturbations : 


CA + GAME, + 6€) = (A + ONE, + 6), 


où £; et Ô£; sont les colonnes de coordonnées de x; et ôx;. Simplifions cette 


$ 2] CONDITIONNEMENT 395 


relation en négligeant les produits de perturbations. Il vient 
OAE, + AÔE, = NÔE, + ÔXE.. (16) 
En multipliant les deux membres de cette égalité par la ligne ‘#,, on obtient 
IpÔAËE, + l'y AÔE, = N'a ôE, + ÔÀ'uË;, 


d’où ne 
ôÀ, = "nôAË; 
S; 
et 
D 
KA 


Ainsi donc, si Îs,l n’est pas trop petit, lôX,I est comparable à 15 A1. Pour 
un Îs.i petit, la sensibilité de la valeur propre À, aux perturbations de la 
matrice devient importante. 

En multipliant les deux membres de l’égalité (16) par ‘ ,; pour j#i,on 
obtient | 


lÔAË; + À'yôE, = À'y.6E;. 
d'où, si À, est différent de X,, 


Le 
"4,08; = 1 "1 


Les produits du premier membre ne diffèrent des composantes correspon- 
dantes de la perturbation ôx. dans la base Ix,, .., x, Ï que par les facteurs 
s;. En effet, soit 

ÔX, = ax, + .… + a,Xx,. 
Dans ce cas, 

"njèk = j'a; = as. 

Notons J; l’ensemble des numéros j pour lesquels À, # X;. Alors pour 
tous les je Jon a 
___‘#6AË, 


©: . 
7 G—nx)s 


La perturbation ôx; a été définie de manière que ses composantes suivant 
les vecteurs X; soient égales à zéro pour j é J.. Par suite, 


‘Et, = D AE à, (1) 
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et sa norme ne dépasse pas 
lô AN y (IX, — À; Is;1)7?. 


Hd; 


Cela montre que le vecteur propre associé à À. est plus sensible aux pertur- 
bations de la matrice si À; est proche des autres valeurs propres. 

L'expression (17) contient les facteurs $, correspondant aux valeurs pro- 
pres qui diffèrent de X,. Leur petitesse peut témoigner de la grande valeur 
de la norme de ôx.. Mais il peut s'avérer que le vecteur ôx; est petit en 
norme, tandis que sont grandes certaines de ses composantes dans la base 
Ix,, .…, x, car les vecteurs de base sont proches des vecteurs linéairement 
dépendants. 

Le coefficient s; est égal au cosinus de l’angle forme par les vecteurs L 
et &. Pour les transformations symétriques, tous les s. atteignent leur 
valeur maximale 1. La grandeur Îs la | est appelée coefficient de gauchisse- 
ment de la transformation À. 

Etudions le lien entre les coefficients de gauchissement et le nombre 
p (A). Connaïissant les vecteurs x, on est en mesure de construire une 
matrice S diagonalisant la matrice 4. Considérons la matrice S dont les 


colonnes sont &./VIs.l. Alors, les lignes de sa matrice inverse seront 
14,/V Is;l. Pour la matrice S on a 


Ce(S) (5 sn) (E sr = È Is. 


Or 
(A) & c(S) < cE(S). 


Donc, 
(A) < D Is” 11. (18) 
im) 


Si toutes les valeurs propres sont distinctes, l’orientation de chaque vec- 
teur propre est définie au sens du vecteur près, de sorte que les coefficients 
de gauchissement sont déterminés de façon univoque. Mais si une transfor- 
mation de structure simple possède des valeurs propres multiples, les coef- 
ficients de gauchissement dépendent de la base choisie. 

Considérons, par exemple, une transformation symétrique dans un 
espace tridimensionnel, possédant les valeurs propres 1, 2, 2. Dans une 
base orthonormée de vecteurs propres, tous les coefficients de gauchisse- 
ment possèdent leur valeur minimale 1. Mais si l’on fait tourner l’un des 
vecteurs correspondant à À = 2 de l’angle +r/3 dans son sous-espace bidi- 
mensionnel, il lui correspondra le coefficient de gauchissement égal à 2. 
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Pour éviter l’influence de cette non-univocité, dans le cas des racines 
multiples il faut étudier les bornes inférieures des coefficients de gauchisse- 
ment suivant toutes les bases. Il va de soi que cela complique fortement leur 
utilisation. 

Lors de la déduction de la formule (18), on partait d’une base de vec- 
teurs propres arbitraire, si bien que l'inégalité (18) est également vérifiée 
pour les bornes inférieures des coefficients de gauchissement. 

Le résultat suivant n’est vrai que pour les transformations qui n’admet- 
tent pas de valeurs propres multiples. A savoir, pour tout à, 


Is711 < »(4). (19) 


En effet, étant donné une matrice S diagonalisant 4, on peut choisir les 
bases Ix,, …, x, et 1y,, .…, y,Ï en posant 


E = un ST 
i NSel  "  l'eS-1l’ 


où e; est une colonne de la matrice unité. D'où 
Is A = ASel-l'e. SU < ISR-ES TUE = c(S). 


Si les coefficients de gauchissement sont déterminés de façon univoque et la 
relation précédente est vérifiée pour toute matrice S, il s’ensuit l’assertion 
nécessaire. 


8 3. Méthodes directes de résolution des systèmes 
d'équations linéaires 


On décrira dans ce paragraphe les principales méthodes directes de 
résolution des systèmes d’équations linéaires. Ces méthodes conduisent 
théoriquement à une solution exacte du système et par suite s’appellent 
aussi méthodes exactes à la différence des méthodes itératives fournissant 
en principe une solution approchée. Les méthodes itératives seront étudiées 
au 6 5. 

Soit donné un système d'équations linéaires de la forme 


Ax = b, (1) 


où À est une matrice carrée régulière d’ordre n. Par matrice régulière on 
entend ici et plus loin une matrice qui n’est pas quasi singulière au sens 
indiqué au $ 2. Aucune structure spéciale de la matrice À n’est supposée, 
vu que les méthodes directes sont généralement utilisées pour résoudre les 
systèmes dont les matrices peuvent être enregistrées toutes entières dans la 
mémoire vive de l’ordinateur. On parlera en premier lieu de la résolution 
des systèmes d’équations linéaires mais les mêmes transformations de 


398 INTRODUCTION AUX MÉTHODES NUMÉRIQUES [CH.XIII 


matrices peuvent être utilisées et sont utilisées pour le calcul des détermi- 
nants et des matrices inverses. On le signalera par des remarques appro- 
priées. 

Les méthodes de calcul sont appréciées suivant trois qualités principa- 
les : a) le nombre d'opérations arithmétiques effectuées, qui définit le 
temps de calcul ; b) l'exigence envers la capacité de la mémoire vive et c) la 
précision maximale atteinte par ces méthodes. Bien que la confrontation 
des méthodes soit une affaire délicate car son résultat dépend de circons- 
tances variées et est souvent de nature arbitraire, on peut dégager deux 
groupes de méthodes qui sont les meilleurs. Les méthodes du premier 
groupe peuvent être réunies sous l’appellation commune de méthode de 
Gauss, celles du second groupe sont liées à la multiplication de la matrice 
du système par des matrices de transformations orthogonales. Ce sont ces 
deux groupes de méthodes qui feront l’objet de notre étude ultérieure. 

1. Méthode de Gauss. D'une façon générale, la méthode de Gauss sert à 
transformer une matrice À en matrice unité par des opérations élémentaires 
sur les lignes de À. Si la matrice À est une matrice complète (contenant la 
matrice-colonne des seconds membres), la dernière colonne devient la solu- 
tion du système. 

Il existe plusieurs suites de transformations élémentaires pour passer de 
la matrice donnée à la matrice unité, ce qui engendre toute une série d’algo- 
rithmes réalisant la méthode de Gauss. L’un d’eux a été utilisé au $ 4 du 
ch. V pour réduire la matrice à la forme simplifiée. Passons maintenant à 
l’algorithme appelé schéma de division unique. 

Ce schéma comprend une série d’étapes successives où la matrice ini- 
tiale A = AO se transforme en matrices A(!), 40), ... Commençons par le 
plus simple des cas quand tous les mineurs principaux de la matrice À, 
c’est-à-dire les mineurs de la forme 


a, , ee dk 


sont différents de zéro, ce qui permet d’omettre les opérations élémentaires 
de permutation des lignes et des colonnes. 

Au cours de la première étape du schéma, la matrice À se transforme en 
matrice 4 (1) dont la première colonne est celle de la matrice unité d’ordre n. 
Par hypothèse, le mineur du premier ordre, égal à l’élément a,,, est diffé- 
rent de zéro. En divisant la première ligne de À par a,, (division unique), on 
transforme la matrice À en A”, où a, = let a,, = a,, pour tous les 
k > 2. Ensuite, pour & = 2, ..…, ñ, on retranche la première ligne multi- 
pliée par a,, de la &-ième ligne dans la matrice À ”. On obtient ainsi la 
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matrice de la forme 


1 af .… al 

1) (1) 

A) 0 af .…e a, 
1 1 

0 af} al} 


Notons que dans les transformations décrites on ajoute une ligne à des 
lignes situées au-dessous d’elle et, par suite, les mineurs principaux de la 
matrice ne peuvent s’annuler. Ainsi donc, les mineurs principaux de la 
matrice 4 (1) sont différents de zéro. Il en découle que l’élément af) de cette 
matrice est non nul car le mineur principal d’ordre 2 vaut a}. 

La deuxième étape du schéma de division unique consiste en äpplication 
des transformations de la première étape à une sous-matrice de la matrice 
A), qui est formée des lignes et des colonnes de numéros 2, …, n. On 
obtient ainsi la matrice 


1 af) … a 

2) 

4® = [19 1 af, 
0 O a 


dont les deux premières colonnes ont les unités sur la diagonale principale 
et les zéros au-dessous de la diagonale. 

Dans les transformations effectuées, une ligne s’ajoutait de nouveau à 
celles d’au-dessous et, par suite, les mineurs principaux de la matrice 4) 
ne sont pas nuls. En particulier, est différent de zéro l’elément a à) qui est 
égal au mineur principal d’ordre 3 de la matrice A). 

A la troisième étape, on transforme la sous-matrice de la matrice A(), 
formée des lignes et des colonnes de numéros 3, …, n. Et ainsi de suite. A la 
k-ième étape, les transformations de la première étape sont appliquées à la 
sous-matrice de la matrice 4-1), formée des n — k + 1 dernières lignes 
et colonnes. Dans la matrice 4(*) obtenue, l'élément a{f), ,,, est différent 
de zéro, sinon s’annulerait par des transformations élémentaires des lignes 
le mineur principal d’ordre # + 1 de la matrice A. 

Après la (7 — 1)-ième étape on obtient la matrice A{7-1), dont tous les 
éléments sur la diagonale principale, sauf a{- 1), sont égaux à 1, et les élé- 
ments situés au-dessous de la diagonale principales sont nuls. 

Les matrices dont les éléments situés au-dessous de la diagonale sont 
nuls sont appelées matrices triangulaires supérieures (voir p. 307). En divi- 
sant la dernière ligne de la matrice 4(7-1) par a*- 1), on obtient la matrice 
triangulaire supérieure 47) = U avec des unités sur la diagonale prineir. 
pale. LE 
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Le processus, décrit plus haut, de transformation de la matrice À par 
des opérations élémentaires en matrice triangulaire supérieure U porte le 
nom de méthode d'élimination directe ou de méthode de Gauss au sens res- 
treint du terme. 

Si on effectue toutes les opérations élémentaires sur les lignes de la 
matrice complète, on obtient un système d’âquations linéaires à matrice 
triangulaire 

Ux = b, 


qui est équivalent au système (1) (voir proposition 2, $ 4, ch. V). Il peut 
être résolu facilement. En effet, la dernière équation du système est de la 
forme x, = b,. De plus, quel que soit K, si x,, ..., x, sont définis, la 
(X — 1)-ième équation entraîne 


Xp = Des — D Us, ;X;- (2) 
j=k 


En appliquant cette formule successivement pour Æ = ñn, .…, 2, on obtient 
toutes les composantes de la solution sans recourir à la division. 

Le procédé décrit de résolution du système à matrice triangulaire est 
appelé méthode de substitution inverse. 

Au lieu d’effectuer une substitution inverse, on peut transformer U en 
matrice unité à l’aide des opérations élémentaires sur les lignes, analogues à 
celles qui transforment 4 en U. A cet effet retranchons la n-ième ligne mul- 
tipliée par des facteurs convenables de toutes les lignes situées au-dessus 
d’elle, de sorte que tous les éléments de la n#-ième colonne situés au-dessus 
de la diagonale s’annulent. Ensuite, en nous servant de la (n — 1)-ième 
ligne, annulons les éléments de la (n7 — 1)-ième colonne situés au-dessus de 
la diagonale, etc. Ce processus de transformation est appelé marche (ou 
opération ) inverse de la méthode de Gauss. 

Si toutes les opérations sont effectuées sur les lignes d’une matrice com- 
plète, le système sera remplacé, à la suite d’opérations directe et inverse de 
la méthode de Gauss, par un système équivalent à matrice unité, c’est-à- 
dire sera résolu. 

Notons que l'opération inverse de la méthode de Gauss exige un plus 
grand nombre d’opérations arithmétiques que la résolution du système à 
matrice triangulaire par les formules (2). 

On reviendra plus loin dans le point 3 au schéma de division unique en 
décrivant comment se libérer de l’hypothèse restrictive que tous les mineurs 
principaux de la matrice sont différents de zéro. Maintenant, on étudiera 
sommairement la méthode dite d'élimination optimale qui servira d’exem- 
ple du degré de modification des caractéristiques de l’algorithme avec la 
variation de l’ordre des opérations effectuées. 
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Le processus d’élimination optimale débute comme le schéma de divi- 
sion unique par la division de tous les éléments de la première ligne par a,.. 
(On admet toujours que tous les mineurs principaux de la matrice sont dif- 
férents de zéro.) La nouvelle première ligne est multipliée par a,, et retran- 
chée de la deuxième. Toutefois, on ne procède pas à la transformation de la 
troisième ligne, mais à l’aide de la deuxième on annule le premier élément 
dans la deuxième colonne et c’est seulement alors qu’on passe à la troisième 
ligne. 

Dans la troisième ligne, à l’aide des deux premières, on annule les deux 
premiers éléments et, à l’aide de la troisième ligne, on annule les deux pre- 
miers éléments de la troisième colonne. Sans entrer dans les détails, posons 
qu'après £ étapes les £ premières lignes sont transformées de manière que 
les parties des k premières colonnes qui y sont contenues se confondent 
avec les colonnes de la matrice unité d’ordre &. Ala(k + 1)-ième étape on 
ajoute àla(£ + 1)-ième ligne les lignes de numéros 1, ..., £ multipliées par 
des facteurs convenables pour annuler ses # premiers éléments. Ensuite, on 
divise la (k + 1)-ième ligne par son (4 + 1)-ième élément et, après la mul- 
tiplication par les éléments adéquats, on la retranche des lignes situées 
au-dessus d'elle, de manière à annuler les À premiers éléments de la 
(k + l)-ième colonne. 

Ainsi, dans la méthode d'élimination optimale on procède tour à tour 
aux opérations directe et inverse de la méthode de Gauss. Cela permet de ne 
pas introduire dans la mémoire vive de l’ordinateur la (& + 1)-ième ligne 
avant que ne soient transformées les lignes précédentes. 

Après la transformation de k lignes, le nombre d’éléments à mémoriser 
diminue dans ces lignes de #2? et devient égal à nk — k?. La valeur maxi- 
male de cette expression est atteinte, si 7 est pair, pour # = n/2 et vaut 
n?/4. Pour un ñn impair, le résultat a une valeur proche. Donc, la résolution 
du système à l’aide de la méthode d’élimination optimale exige une capacité 
de la mémoire vive à peu près quatre fois moindre qu’avec l’utilisation du 
schéma de division unique. 

2. LU-décomposition. On sait qu’une transformation élémentaire quel- 
conque des lignes de la matrice À équivaut à la multiplication de À à gau- 
che par une matrice régulière, et qu’une suite de telles transformations, à la 
multiplication par la matrice S égale au produit de matrices correspondan- 
tes. Pour obtenir la matrice S, il suffit d'effectuer successivement toutes les 
opérations élémentaires sur la matrice unité. (En effet, on obtient ainsi la 
matrice SE, c’est-à-dire S.) En transformant la matrice À en matrice trian- 
gulaire supérieure U, on effectue une suite déterminée d’opérations élé- 
mentaires. On voit aussitôt que cette suite d’opérations transforme E en 
une matrice triangulaire inférieure S. En effet, outre la multiplication des 
lignes par des nombres, on ne se sert que de l’addition d’une ligne à des 
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lignes situées au-dessous d'elle. Dans ce cas, tous les éléments de la matrice 
unité transformée, se trouvant au-dessus de la diagonale restent nuls. Ainsi 
donc, on a la proposition suivante. 


PROPOSITION 1. Pour toute matrice À dont les mineurs principaux sont 
non nuls, il existe une matrice triangulaire inférieure régulière S telle que 
SA est la matrice triangulaire supérieure U avec des unités sur la diagonale 
principale. 

Démontrons ensuite la 


PROPOSITION 2. La matrice L inverse de la matrice triangulaire inférieure 
S de la proposition 1 est elle-même une matrice triangulaire inférieure de la 
Jorme 


jan 0 … 0 … 0 

a, a) … 0 5 Ô 
pales 

SR an 0 

CE ER PE 


où a % = sont des éléments de la matrice À (&—1) obtenue suivant le schéma 
de division unique à la (K — 1)-ième étape. 


Pour le démontrer, considérons les transformations élémentaires du 
schéma de division unique comme résultat de multiplication par la matrice. 
Notons SX) une matrice telle que 


AK) = SU) AGk-D. 


A la k-ième étape, on divise la &-ième ligne de la matrice AD par af 1 
et on soustrait la ligne obtenue multipliée par a{%- 1) de toutes les lignes de 
numéros m = k + 1, .…, n. La matrice S(%) est obtenue à partir de la 
matrice unité à l’aide des mêmes transformations élémentaires et, par suite, 
n’en diffère que par les éléments de la £-ième colonne, qui se trouvent sur 
ou sous la diagonale : 

l: 35: 07 se 0 


0 Se | 
Icis{) = (af) lets 4) = qu l/a- pour m > k. 


Il nous faut démontrer que 
St)... SASUL = E, 
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Considérons le produit S(!) L. La première colonne de L coïncide avec la 
première colonne de À, et la multiplication à gauche par S'!) transforme la 
première colonne de À en première colonne e, de la matrice unité, de sorte 
que la première colonne de la matrice S!!) L se confond avec e,. Les autres 
colonnes de la matrice S!1)L sont les mêmes que dans la matrice L. En 
effet, la multiplication par S!!) est équivalente à l’addition de la première 
ligne multipliée par des facteurs appropriés à des lignes situées au-dessous 
d'elle ; quant aux éléments de la première ligne de L, ils sont nuls à partir 
du second. 

Ensuite, la multiplication à gauche par S() est équivalente à l’addition 
de la deuxième ligne multipliée par des facteurs convenables à des lignes se 
trouvant au-dessous d’elle. Dans la matrice S()Z, tous les éléments de la 
deuxième ligne, sauf a{}, sont nuls. Donc S) S(1) L ne diffère de SL que 
par la deuxième colonne. Les éléments de la deuxième colonne de la 
matrice S(!) L situés sur ou sous la diagonale coïncident avec les éléments 
homologues de la matrice A(1). Par suite, la multiplication par S®) trans- 
forme la deuxième colonne de la matrice S!!) L en deuxième colonne de la 
matrice unité. 

En continuant de raisonner ainsi pour toutes les autres matrices S{'), on 
aboutit à l’assertion nécessaire. 

Il est très important que les éléments de la &-ième colonne de la matrice 
L sont des éléments de la matrice 4A(%-1), Si la matrice À ne doit pas être 
conservée ou si elle est stockée dans la mémoire externe, on peut, après cha- 
que transformation élémentaire, enregistrer les éléments de la matrice obte- 
nue à l’endroit des éléments correspondants de la matrice qui a subi une 
transformation. Dans ce cas, les éléments de la matrice L peuvent être enre- 
gistrés à la place des zéros (au-dessous de la diagonale) ou des unités (sur la 
diagonale) dans la matrice transformée. Après toutes les transformations, 
on obtient au-dessus de la diagonale les éléments de la matrice U qui ne 
sont pas a priori des zéros ou des unités, les autres places étant réservées 
aux éléments de la matrice L. 


DÉFINITION. La décomposition de la matrice À en produit LU d’une 
matrice triangulaire inférieure régulière ZL et d’une matrice triangulaire 
supérieure U avec des unités sur la diagonale principale est appelée 
LU-décomposition *) de la matrice À. 

Il découle des propositions 1 et 2 le théorème suivant. 


THÉORÈME 1. La matrice À admet la LU-décomposition si tous ses 
mineurs principaux (le déterminant y compris) sont différents de zéro. 


*) D'après les premières lettres des mots anglais « upper » et « lower » signifiant 
« supérieur » et « inféricur ». 


0" 
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On obtient la LU-décomposition en indiquant un algorithme qui per- 
met de la calculer. Ceci étant, on n’a pas prêté attention à deux circonstan- 
ces. On le fera à l’aide de la proposition suivante qui contient d’ailleurs une 
autre démonstration de l’existence de cette décomposition. 


PROPOSITION 3. Pour que la LU-décomposition de la matrice À existe, il 
est nécessaire (et suffisant) que les mineurs principaux de À soient non 
nuls. Si la LU-décomposition existe, elle est unique. 


DÉMONSTRATION. Soient S = L-!et U = SA. Notons U,, S, et À, les 
sous-matrices des matrices U, S et À, qui sont situées à l’intersection des 
lignes et des colonnes de numéros 1, .…, &. Les éléments de U, sont les pro- 
duits des lignes de S par les colonnes de À, les numéros des lignes et des 
colonnes ne dépassant pas £. Or S est une matrice triangulaire inférieure. 
Donc, ces produits sont les mêmes que ceux des lignes de S, par les colon- 
nes de À4,. D'ou on a U, = S,AÀ,. 

Vu que det U, # 0, on a aussi det À, # 0, et par suite, les mineurs 
principaux de À doivent nécessairement être différents de zéro pour que la 
LU-décomposition existe. 

On sait que la dernière ligne du produit est une combinaison linéaire des 
lignes du second facteur, dont les coefficients sont égaux aux éléments de la 
dernière ligne du premier facteur. La dernière ligne de U, est la dernière 
ligne de la matrice unité et par suite, est parfaitement définie. Les lignes de 
À, sont linéairement indépendantes, de sorte que chaque ligne à £ éléments 
se décompose suivant ses dernières de façon unique. Donc, la k-ième ligne 
de S, est parfaitement définie. 

Or on obtient la £&-ième ligne de S à partir de la k-ième ligne de S, en lui 
joignant 7 — k zéros. Vu que & est arbitraire, il s’ensuit que la matrice S 
est parfaitement définie. Ensuite, L se définit de façon unique en tant que 
S=!\,et U en tant que SA. 

REMARQUE. Soulignons que n’est unique que la décomposition dont la 
deuxième matrice triangulaire possède des unités sur la diagonale princi- 
pale. Il existe en général plusieurs décompositions en matrices triangulai- 
res, en particulier, celle dont la première matrice possède des unités sur la 
diagonale principale. 

La matrice L peut être représentée comme produit de la matrice L, avec 
des unités sur la diagonale principale et de la matrice diagonale D. On a 
alors la 


PROPOSITION 4. La matrice À dont les mineurs principaux ne sont pas 
nuls peut être décomposée d’une façon unique en produit L, DU, où D est 
une matrice diagonale et L, et U sont des matrices triangulaires inférieure 
>t supérieure avec des unités sur la diagonale principale. 


L’unicité de …. $comssgsit‘-n mentionnée découle de l’unicité de la 
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LU-décomposition, vu que la représentation L = L, D est évidemment 
aussi unique. 

Considérons la ZLDU-décomposition, obtenue dans la proposition 4, 
pour le cas particulier d’une matrice symétrique 4. Alors 
A = 'ÀA = !'U D'L, où 'U est la matrice triangulaire inférieure et ‘L la 
matrice triangulaire supérieure, toutes deux avec des unités sur la diagonale 
principale. En vertu de l’unicité de la décomposition, on a L = ‘Uet 


A = 'UDU. (3) 


En interprétant la matrice À comme une matrice associée à la forme 
quadratique, on peut considérer que l’égalité (3) exprime le passage à une 
base dans laquelle la forme quadratique se définit par une matrice diago- 
nale D. 

En particulier, si tous les mineurs principaux de la matrice À sont stric- 
tement positifs, la forme quadratique est définie positive et tous les éléments 
diagonaux de la matrice D sont strictement positifs. Si D = diag (d,, … 


…, d,), où tous les d, > 0, on peut introduire la matrice D'/2 = diag (Vd,, … 
…, Vd,) et la matrice V = D'/2U. Il vient alors 


A = y. (4) 


Il existe un algorithme efficace permettant d’obtenir directement la 
décomposition (4) pour une matrice À définie positive. On le décrira au 
point S. 

Notons que la décomposition (4) n’est pas un fait inattendu. On peut 
considérer toute matrice définie positive comme la matrice de Gram d’une 
base e pour un produit scalaire convenablement défini. La formule (4) peut 
alors être interprétée comme la relation entre les matrices de Gram de deux 
bases, à savoir : la base e et la base orthonormée par rapport au produit 
scalaire considéré, la matrice de passage étant une matrice triangulaire 
supérieure. La matrice inverse de cette dernière, c’est-à-dire la matrice de 
passage de e à une base orthonormée, est aussi une matrice triangulaire. La 
construction de la matrice de passage d’une base quelconque à une base 
orthonormée est réalisée par orthogonalisation de Gram-Schmidt. Il est 
aisé de vérifier que ce processus aboutit à une base orthonormée dont le 
k-ième vecteur est la combinaison linéaire des vecteurs e,, …, e, de la base 
e. Ainsi, le processus d’orthogonalisation de Gram-Schmidt conduit juste- 
ment à la matrice triangulaire supérieure qui est inverse de la matrice V 
dans la décomposition (4). 

Revenons au sujet principal de ce point pour souligner l’importance du 
résultat obtenu. La LU-décomposition joue un grand rôle dans les métho- 
des numériques de résolution des systèmes d’équations linéaires, de calculs 
des déterminants et d’inversion des matrices. En effet, une grande partie 
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des difficultés liées à la résolution des problèmes mentionnés peut être rap- 
portée à la recherche de la LU-décomposition. Si la matrice du système 
d’équations linéaires se présente sous forme de produit LU, la résolution 
du système se réduit à la résolution successive de deux systèmes à matrices 
triangulaires. À savoir, 4x = b équivaut à Ly = b et Ux = y. 

En notant ensuite que det À = det L det U et det U = 1, on peut cal- 
culer det À comme le produit des éléments diagonaux de la matrice L. 

De même, 4 = LU est équivalent à 4-! = U-!'L-!et, vu que les 
matrices triangulaires peuvent facilement être inversées, le calcul de 4 -! ne 
présente pas de difficulté. 

Le mérite non des moindres de la LU-décomposition est qu’elle occupe 
dans la mémoire vive de l’ordinateur autant de place que la matrice initiale. 

3. Choix d’un élément principal. Considérons maintenant une matrice 
régulière À sans imposer aucune restriction à ses mineurs principaux. Il se 
peut que la condition a, # One soit plus remplie. Dans ce cas, pour trans- 
former la première colonne de la matrice À en colonne de la matrice unité il 
ne suffit plus d’un nombre fini d’opérations élémentaires utilisées dans le 
schéma de division unique, décrit plus haut. Toutefois, si l’on ajoute à ces 
opérations les permutations des lignes (ou des colonnes), on peut ne plus 
exiger dans le théorème 1 que les mineurs principaux soient non nuls. 

En effet, on peut énoncer la proposition suivante. 


PROPOSITION 5. Toute matrice régulière À d'ordre n peut être transfor- 
mée par permutation des seules lignes (ou des seules colonnes) en une 
matrice dont les mineurs principaux sont différents de zéro. 


Les ñ — 1 premières colonnes de la matrice À contiennent nécessaire- 
ment un mineur différent de zéro, car autrement les colonnes seraient 
linéairement dépendantes et det À serait nul. Permutons les lignes de 
manière que ce mineur devienne le mineur principal d’ordre 7 — 1. Soit À‘ 
la matrice obtenue par la permutation réalisée. Il va de soi que dans À ‘on 
peut permuter les lignes de numéros 1, …,n — 1 sans annuler son mineur 
principal d’ordre 7 — 1. Profitons-en pour placer sur la diagonale princi- 
pale le mineur non nul d’ordre 7 — 2 situé quelque part sur les ñ — 1 pre- 
mières lignes et les 7 — 2 premières colonnes. Un tel mineur doit obligatoi- 
rement exister, car autrement le mineur principal d’ordre ñ — 1 serait nul 
dans la matrice À :. 

En continuant d’agir de la sorte avec les mineurs d'ordres décroissants, 
on démontrera l’assertion pour les permutations des lignes. Pour les per- 
mutations des colonnes la démonstration est analogue. 

La permutation des lignes dans une matrice est équivalente à la multi- 
plication à gauche de cette matrice par la matrice P obtenue de la matrice 
unité E par la même permutation des lignes. D’une façon analogue, la per- 
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mutation des colonnes est équivalente à la multiplication à droite par la 
matrice Q obtenue de E par la même permutation des colonnes. Les matri- 
ces P et Q sont appelées matrices de permutation. 

La matrice inverse de la matrice de permutation est une matrice associée 
à la permutation inverse qui retourne les lignes à leurs anciennes places. Vu 
que la matrice de permutation est orthogonale, on a pour elle P-! = 'P. 

En interprétant les permutations mentionnées dans la proposition 5 
comme multiplication par une matrice, on aboutit, en vertu des résultats 
obtenus auparavant sur la LU-décomposition, au théorème suivant. 


THÉORÈME 2. Pour toute matrice régulière À on a les décompositions 
suivantes : 


A = PLU, A =L'U'Q, 
A = PMDV, A = M'D VO, 


où P et Q sont des matrices de permutation, U, U”, Vet V° des marrices 
triangulaires supérieures avec des unités sur la diagonale principale, L, L’, 
M et M° des matrices triangulaires inférieures telles que M et M” possèdent 
des unités sur la diagonale, et D, D‘ sont des matrices diagonales. 


Pour appliquer ce résultat, il faut indiquer un algorithme permettant de 
construire les matrices de permutation ou, ce qui revient au même, indiquer 
la permutation des lignes ou des colonnes rendant les mineurs principaux 
différents de zéro. A la place de cet algorithme, on recourt en général au 
schéma de division unique sous forme modifiée. Ce schéma modifié abou- 
tit à une suite de matrices de transformation où alternent des matrices 
triangulaires et des matrices de permutation. Les modifications sont les sui- 
vantes. 

S’il arrive qu’au début de la première étape l'élément a,, est nul, on per- 
mute les lignes de manière qu’à la place de a,, vienne un élément non nul. 
Cet élément existe obligatoirement dans la première colonne car det À # 0. 
On dira que c’est un élément principal (ou clé) de la première étape. 

De même, si à la deuxième étape on a a{} = O0, la deuxième colonne de 
la matrice À) contient un élément non nul situé au-dessous de la diagonale 
(car autrement les deux premières colonnes seraient linéairement dépen- 
dantes). En permutant les lignes, on peut placer cet élément à la place 
de a{). Il s’appellera élément principal de la deuxième étape. De façon ana- 
logue on détermine un élément principal de chaque étape. 

On a décrit le choix d’un élément principal suivant la colonne. Si on 
remplace les permutations des lignes par celles des colonnes, l’élément prin- 
cipal de la £-ième étape sera sélectionné parmi les éléments de la k-ième 
ligne de la matrice A(%-1), Le choix d’un élément principal suivant la 
matrice entière signifie qu’il est possible de mettre à la place de a{%- 1!) tout 
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élément a" pour i > k, j > k. Notons que le choix d’un élément 
principal suivant la ligne conduit à la deuxième décomposition dans le 
théorème 2. 

Théoriquement, à titre d’élément principal on peut prendre tout éle- 
ment non nul. Toutefois en pratique la situation n’est pas si simple. 
Comme on l’a vu au $ 1, même le résultat de vérification de l’égalité à zéro 
d’un élément peut dépendre de la représentation des nombres dans la 
machine à calculer. Le choix de l’élément principal influe de façon sensible 
sur les erreurs d’arrondi. Aussi, même si l’on a établi que par exemple a,, 
n’est pas nul dans la matrice initiale, cela ne signifie-t-1l nullement qu'il est 
rationnel de le choisir pour élément principal. Considérons à titre d’exem- 
ple le système 


10-#x + y = 1, 
x +y=2 


et admettons que les résultats des opérations arithmétiques sont arrondis à 
trois chiffres significatifs dans le système à virgule flottante. La solution du 
système calculée sans arrondi est : 


x = (1 — 10-4)-1 = 1] + 107 + 1078 + …, 
y=2—-x = 1— 107 — 10-858 — … 


En adoptant 10-* pour élément principal, on doit transformer la matrice 
complète du système de la façon suivante : 


hall wo 11 all 
() > — 10* (9 


112 ] 
Notons que le nombre 2, après qu’on y ait ajouté 10* et arrondi le résultat, 
a disparu, de sorte que si dans le système initial on avait 3 et non pas 2, le 
résultat serait le même. La solution trouvée est x = 0, y = 1, ce qui est 
loin de la solution exacte. 
Mais si après avoir permuter les lignes on choisit 1 pour élément princi- 
pal, la transformation de la matrice complète sera : 


EE is HE el 
2 10-4 111 0 |] 0 1111? 


ce qui nous donne la solution x = 1, y = 1 qui coïncide avec la solution 
exacte arrondie, c’est-à-dire une solution aussi précise qu’il est en général 
possible. 

Dans la première variante, on a vu que la perte de précision était due à 
la nécessité d’additionner les nombres dont les ordres diffèrent de plus que 
de la longueur de la mantisse. Ceci étant, le plus petit nombre disparaît. 
Même pour une différence d’ordres inférieure, une partie de chiffres signi- 


$ 3] MÉTHODES DIRECTES DE RÉSOLUTION DES SYSTÈMES 409 


ficatifs du plus petit terme se perd. Aussi, pour diminuer les erreurs 
d’arrondi, faut-il s'arranger à additionner les nombres dont les ordres sont 
voisins. 

Généralement, on recommande de choisir pour élément principal un 
élément dont le module est maximal dans la partie de la matrice à transfor- 
mer ou, ce qui est moins bon, bien que plus simple, un élément de module 
maximal de la ligne ou colonne considérée. Au point qui suivra on revien- 
dra à cette question. Maintenant, remarquons seulement qu’en multipliant, 
dans l'exemple étudié plus haut, la première équation par 10°, on obtient le 
système 

10x + 19 y = 10°, 


X + y = 2. 


L'élément maximal de la première colonne est 10. En le choisissant pour 
élément principal, on obtient encore une solution peu satisfaisante. 

Dans certains cas, la recherche d’une solution plus précise ne détermine 
pas à elle seule le choix de l’élément principal. Si on applique la méthode de 
Gauss à une matrice creuse (voir p. 382), chaque opération élémentaire fait 
croître en général le nombre d’éléments non nuls dans la matrice. Il peut 
donc arriver qu'on ne puisse enregistrer l’une des matrices transformées 
dans la partie accessible de la mémoire. Dans ce cas, on n’obtiendra pas de 
solution exacte car on n’obtiendra aucune solution. Toutefois, le nombre 
d'éléments non nuls de la matrice peut croître de façon différente suivant le 
choix de l’élément principal. Aussi l’approche suivante est-elle possible. 

On peut estimer a priori la variation du nombre d’éléments non nuls de 
la matrice pour les suites différentes d’éléments principaux choisis et s’arrê- 
ter sur la suite qui donne la valeur minimale (ou admissible) de ce nombre. 
Cette méthode est décrite dans le livre de Twearson [37] déjà mentionné. Il 
va de soi que le procédé proposé est assez laborieux mais il faut prendre en 
compte qu’il est souvent nécessaire de résoudre plusieurs systèmes d’équa- 
tions linéaires ayant une même matrice des coefficients (et ne différant que 
par les seconds membres) ou des matrices qui présentent la même disposi- 
tion des éléments non nuls. Dans ce cas, la peine qu’on se donne pour choi- 
sir une suite d’éléments principaux peut s’avérer justifiée. 

4. Mise à l’échelle. La sélection de l’élément principal est intimement 
liée à la multiplication des équations (ou ce qui revient au même, des lignes 
de la matrice du système) par des facteurs numériques. Cette transforma- 
tion équivaut à la multiplication à gauche par une matrice diagonale et est 
appelée mise à l'échelle des lignes. La multiplication des colonnes par des 
nombres (mise à l'échelle des colonnes) équivaut à la multiplication à 
droite de la matrice du système par une matrice diagonale et peut être inter- 
prétée comme un passage à d’autres unités de mesure pour les inconnues. 
D'où son appellation. 
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Pour facteurs de mise à l’échelle il est commode de choisir les puissan- 
ces de la base du système de numération (de dix par exemple, si le système 
est décimal). Dans l’arithmétique à virgule flottante, ces facteurs ne modi- 
fient que les ordres des éléments en conservant les mantisses, et par suite, la 
mise à l’échelle n’introduit pas d’erreurs d’arrondi supplémentaires. 

Si le’ choix de l’élément principal est déterminé par une règle liée à la 
grandeur des éléments de la matrice, il dépend donc de la mise à l’échelle. 
Par exemple, si pour élément principal de la matrice on choisit le plus 
grand élément en module, une mise à l’échelle convenable peut rendre prin- 
cipal tout élément non nul donné a priori. En effet, par la mise à l’echelle 
des lignes on peut rendre chaque élément non nul de la is-ième ligne plus 
grand en module que tout élément d’une autre ligne. Ensuite, par la mise à 
l'échelle des colonnes, on peut rendre maximal en module l’élément situé à 
l'intersection de la i,-ième ligne et de la j,-ième colonne, cet élément choisi 
restant supérieur aux autres éléments de la j,-ième colonne. 

Les mêmes considérations peuvent être aussi appliquées à la sélection de 
l’élément principal suivant une ligne ou une colonne. 

Mais si le choix de l’élément principal se détermine par une règle ne 
dépendant pas de la grandeur des éléments de la matrice, par exemple, si la 
position des éléments principaux est définie a priori, la mise à l’échelle ne 
change pas la solution. Plus précisément, on aboutit au résultat suivant. 

Supposons pour fixer les idées qu’on utilise l’arithmétique décimale à 
virgule flottante, et considérons deux systèmes d’équations linéaires dont 
les matrices À et À ° diffèrent, par la mise à l’échelle de leurs lignes et 
colonnes, de puissances entières de dix, c’est-à-dire que leurs éléments sont 
liés par les relations 


a; = 10Pi*%;a;., LJ = lin: 
tandis que les seconds membres des deux systèmes satisfont aux conditions 
b;' = 10Pib,, i=1,...,n. 
On peut alors énoncer la proposition qui suit (voir Forsythe, Moler [10]). 


PROPOSITION 6. Supposons que les deux systèmes se résolvent suivant le 
schéma de division unique et que dans les deux systèmes on choisit à cha- 
que étape pour éléments principaux les éléments qui occupent les mêmes 
positions dans les matrices. Dans ce cas, les solutions calculées des deux 
systèmes sont liées par l'égalité 


X; : 107% x;, J = 1,...,n, (S) 


et les mantisses de x; et de x; coïncident si la résolution d’un des systèmes 
n'entraïne pas le zéro de machine ou un dépassement de capacité. 
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(On dit qu’on obtient la solution du second système à partir de celle du 
premier par la « démise à l’échelle ».) 

DÉMONSTRATION. Notons d’abord que les mantisses des éléments corres- 
pondants de deux systèmes envisagés se confondent et que l’arrondisse- 
ment d’un nombre marque sa mantisse et non son ordre qui peut entraîner 
l'apparition d’un dépassement de capacité ou du zéro de machine. 

Vérifions que l’application d’une même opération élémentaire du 
schéma de division unique aux deux matrices fournit les mêmes systèmes ne 
différant que par la mise à l’échelle. Pour simplifier l’écriture, posons qu'il 
s’agit de la première étape dans l’opération directe du schéma de division 
unique. 

Admettons que pour élément principal est choisi un élément situé à 
l'intersection de la £-ième ligne et de la /-ième colonne. Dans la matrice À, 
de la i-ième ligne on retranche le produit de la &-ième ligne par a, /a,,. Dans 
ce cas, le j-ième élément de la ligne obtenue est égal à 


€. 
D = Qg. — -Ù q.. 
a; a; a, d,;- 


Dans la matrice À ”, une transformation analogue donne 


"(1 +4, a; 10777 +4) + (1 
a; 0) = a;,10” D am ee ay 10/4 J — 10”: taf). 
k ! 
a,,107 
Pour les éléments de la £-ième ligne dans la matrice À ” transformée on a 
a = i.= LS = 107% %a{). 
a, a,,10°* ! 


En particulier, a, = af} = 1 pour j = /. Dans la matrice-colonne b' 
des termes constants on retranche du i-ième élément le k-ième multiplié par 
a; /ay, : 


b' = b;10° — b, 10/* 1. b( 1071. 
a,,10*" 


De plus, le k-ième élément de la matrice-colonne des termes constants doit 
être divisé par a,, : 


b, 107+ 
a,,107#*" 


Ainsi donc, les deux systèmes transformés sont liés de la même façon 
que les systèmes initiaux, et les facteurs de mise à l’échelle n’ont pas varié, 
à l'exception du facteur de la k-ième ligne qu’on a remplacé par 10-97 du 
fait de la division par a,,. Les opérations directe et inverse étant réalisées, 


b,\ = = bin) 107%. 
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on aboutit aux systèmes à matrices unités (à condition de faire toutes les 
permutations nécessaires). Dans les opérations directe et inverse, chaque 
ligne a rempli son rôle de ligne clé une seule fois, et lors de l’opération 
inverse on n’a pas effectué la division. C’est pourquoi le facteur de mise à 
l’échelle de la ligne contenant l’unité à la /-ième place vaut 104. On abou- 
tit ainsi à l’expression (5). La proposition est démontrée. 

Les raisonnements faits montrent que si on convient de choisir pour élé- 
ment principal l’élément maximal de la colonne, on ne fixe pas pour le 
système donné une suite d’éléments principaux mais on établit une relation 
entre les mises à l’échelle et les suites d'éléments principaux. Avec cette 
règle de sélection d'éléments principaux, on ne doit pas ignorer la mise à 
l'échelle : sans introduire les facteurs de mise à l’échelle on conserve celle-ci 
telle qu’elle était, ce qui n’est peut-être pas sa meilleure variante. 

A ce qu’il paraît, la meilleure mise à l’échelle doit être celle pour 
laquelle le nombre conditionnel de la matrice est minimal. Or les algorith- 
mes efficaces au choix de telle mise à l’échelle ne sont pas connus. On se 
sert ainsi de l’approche suivante. 

Soit une norme | * sur l’espace des matrices-colonnes à n éléments. 
Une matrice d’ordre n est dite équipondérante en colonnes (resp. lignes) 
par rapport à la norme choisie si chacune de ses colonnes (resp. lignes) véri- 
fie la condition 


0,1 < lal < 1 


(pour le système de numération décimale). La matrice est dite équipondé- 
rante si elle est équipondérante en lignes et colonnes. 

Avant de résoudre un système d'équations linéaires, on peut mettre à 
l’échelle sa matrice de façon qu’elle devienne équipondérante. Le défaut de 
ce procédé est qu’il peut engendrer plusieurs matrices équipondérantes con- 
ditionnées très différemment. 

S. Calculs avec double précision et schéma compact. Toute une série 
d'ordinateurs présente des possibilités techniques, traduites dans les langa- 
ges de programmation qui y sont adoptés (Fortran IV, PL/1), d'effectuer 
tous les calculs avec un nombre double de chiffres, ce qui augmente évi- 
demment, de façon sensible, la précision du résultat. On ne s’arrêtera pas 
sur la discussion de ces possibilités car on n’a nulle part fixé le nombre f de 
chiffres significatifs et son doublement n’apportera rien de nouveau à nos 
raisonnements. Toutefois, l’analyse des erreurs d’arrondi montre que tous 
les calculs effectués suivant un algorithme quelconque n’ont pas la même 
influence sur la précision du résultat. La précision de tout le processus de 
calcul peut être souvent fortement améliorée du fait de l’accroissement de 
la précision d’une seule partie de ces calculs. 

Pour une large classe de calculateurs, il existe une possibilité d'obtenir, 
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avec une grande précision et d’une façon relativement simple, sans presque 
augmenter le temps de calcul, les expressions de la forme La, 8, , c'est-à- 
dire les produits de lignes par des colonnes. C’est ce qu’on appelle ca/cul du 
produit scalaire en régime d’'accumulation. Voyons plus en. détail de quoi il 
s’agit. 

Supposons qu'on doit multiplier deux nombres dans le système à vir- 
gule flottante. Il faut pour cela additionner leurs ordres et multiplier les 
mantisses. Si les mantisses sont des nombres décimaux à ? chiffres, leur 
produit exact aura 217 chiffres. Le produit des mantisses est supérieur à 
0,01, mais il peut être inférieur à 0,1. Dans ce dernier cas, on doit le multi- 
plier par 10 et oter 1 de l’ordre. Après quoi, le produit des mantisses est 
arrondi jusqu’à t chiffres. Le nombre obtenu sera la mantisse du produit, 
tandis que les chiffres rejettés définissent l’erreur d’arrondi. 

Toutefois, si l’on a besoin de la somme de produits, on peut se passer de 
l’arrondi et, au fur et à mesure du calcul de produits, les additionner à la 
somme des produits déjà obtenus en les interprétant comme des nombres à 
2t chiffres significatifs dans le système à virgule flottante. Dans ce cas, on 
n’arrondit jusqu’à { chiffres significatifs qu'après avoir additionné le der- 
nier produit. La somme de produits ainsi calculée diffère par rapport à sa 
valeur exacte d’une grandeur qui dépasse très peu cette erreur d’arrondi, à 
condition qu’il ne se produise dans l’addition une grande perte de chiffres 
significatifs due à la présence des termes dont les ordres diffèrent sensible- 
ment. La démonstration de ce fait peut être trouvée dans le livre de Forsy- 
the et Moler [10]. 

Le calcul de la somme de produits figure pratiquement dans tous les 
algorithmes de résolution des problèmes d’algèbre linéaire, si bien que la 
possibilité de calculer de telles sommes avec de plus faibles erreurs 
d’arrondi est très importante. Fixons l’attention sur le fait que la formule 
(2) par exemple permet de résoudre Ie système d'équations linéaires à 
matrice triangulaire par le calcul de la somme de produits. Ainsi donc, en 
utilisant le régime d’accumulation, on obtient une solution du système qui 
ontient des erreurs d’arrondi comparables à l’erreur d’arrondi produite 
par une seule multiplication. 

La possibilité de calculer la somme de produits en régime d’accumula- 
tion a engendré la création d’une série d’algorithmes permettant de mieux 
utiliser cette possibilité. Etudions un algorithme de recherche de la 
LU-décomposition, appelé schéma compact de la méthode de Gauss. 

L'égalité matricielle À = LU est équivalente à 7? égalités numériques 


nñn 
a; — D le U,;: 
Ka] 
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Vu que L et U sont des matrices triangulaires, on a /,, = 0 pour &k > i, et 
Uy; = 0 pour & > 7. Donc, 


dj — » PU PRE (6) 
kK=]! 


oùr = min (i, j). Ces n°? égalités peuvent être groupées suivant les valeurs 
de r. Ainsi, pour 7 = lonaou/ > i = 1,oui > j = 1, de sorte que le 
groupe défini par 7 = 1 est constitué des équations 

a; = lu, FL, 


a, =lu, i>j=1. 


Vu que U possède des unités sur la diagonale principale, u,, = 1 et l’on 
obtient 

l, = a, pour tous les i > 1. 
En particulier, /,, = a,, et, par suite, /,, # 0 si les mineurs principaux de 


la matrice À sont différents de zéro. On peut maintenant trouver 


a, ; . 
= 1] pour tous les j > 1. 

11 

Admettons maintenant que dans les groupes d’équations correspondant 
aux valeurs der = 1,...,5 — 1, on a trouvé {, et u,; pour tous j et j et tous 
les r < s — 1. Ecrivons le groupe d’équations correspondant à 7 = s sous 
la forme 


U; 


s-1 


a; = lu; + D) le Uyj- 
K=] 


Il s'ensuit pour i > j = s, en vertu deu, = 1, que 


s—1 


l, = a, — D lu. 
K=] 


La somme dans le second membre de l'égalité se compose des éléments déjà 
connus, et donc on a trouvé /. pour i > s. Pour i < s, posons /, = 0. 
Sij>i=s,ona 


s— 1 


[su = 4; — D PU PE 
Km 


Démontrons que /. # 0. En effet, s’il n’en est pas ainsi, ou bien n'existe 
aucun nombre U.; vérifiant la dernière égalité, ou bien il en existe une infi- 
nité (suivant que le premier membre de l’égalité est nul ou non). Dans les 
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deux cas, on aboutit à la contradiction avec la proposition 3. Donc, 


s— 1 


y Lx U,; 
k = 


U,;, = —_— — pour tous les j > s. 
ANT 

Pour j < s posons 4,, = 0. Ainsi donc, en utilisant l’équation (6) pour 
r = 1,...,s, on a obtenu tous les /; et u,., ce qui montre que tous les élé- 
ments des. matrices L et U peuvent être calculés successivement avec utilisa- 
tion du régime d’accumulation. On peut montrer que parmi toutes les 
méthodes connues le schéma compact décrit ici de la méthode de Gauss 
présente la meilleure majoration pour la norme de la perturbation des don- 
nées initiales, quand cette perturbation est équivalente à l’influence des 
erreurs d’arrondi. Le nombre d’opérations arithmétiques réalisées d’après 
ce schéma, ainsi que la capacité nécessaire de la mémoire sont à peu près les 
mêmes que ceux du schéma de division unique, c’est-à-dire sont proches du 
minimum possible. 

REMARQUE. On a montré plus haut que les éléments diagonaux par les- 
quels on doit effectuer les divisions dans le schéma compact sont différents 
de zéro. Or cela ne garantit qu’une possibilité théorique de la réalisation 
des calculs. Pour que ces calculs deviennent pratiquement réalisables et sta- 
bles par rapport aux perturbations des données initiales et aux erreurs 
d’arrondi, il faut que les nombres /,. ne soient pas petits ou, ce qui revient 
au même, que les nombres y, ne soient pas grands. Pour ces derniers on a 
u,, = aû, où af) est un élément de la matrice At construite dans le 
schéma de division unique. La même condition, absence de grands élé- 
ments dans la matrice A5), apparaît aussi dans l’étude de la stabilité du 
schéma de division unique. 

On a étudié ici l’utilisation du schéma compact à la recherche de la 
LU-décomposition, c’est-à-dire admis que les mineurs diagonaux de la 
matrice À sont différents de zéro. Il faut noter que le schéma compact pos- 
sède le défaut fondamental de la méthode de Gauss : la stabilité du proces- 
sus de calcul est fonction du choix des éléments principaux ou, dans le cas 
considéré, de l’ordre dans lequel se disposent les lignes et les colonnes de la 
matrice avant le calcul. 

On a montré plus haut que toute matrice symétrique définie positive 
admet une décomposition de la forme À = V!F, où Vest la matrice trian- 
gulaire inférieure. La modification du schéma compact de recherche de 
cette décomposition s'appelle méthode de la racine carrée. La décomposi- 
tion cherchée, exprimée par les éléments des matrices, est de la forme 


f 
y TA TE 
&-1 
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où r = min (i, j). De même que les équations (6), ces équations peuvent 
être résolues successivement. En effet, pour i = j = leti>j=1lona 
respectivement 
: 
dy Up EU Gi = VV, 

d'où v,, = Va, v;, = a;,,/Va. 

Ensuite, si sont connus v, pour & = 1, ..….,s — 1 et pour tous les i, 
l'égalité (pour i = j =s) 


s— 1 
=. 2 
ds — Vs + D Uk 
Ka! 
permet de trouver v.,, et l'égalité (pour i > j = 5) 


s—] 
ds = Lt + À Vyv 
Km] 


donne v,.. Toutes les divisions et les extractions de racine peuvent en prin- 
cipe être réalisées, vu que la décomposition cherchée, comme on l’a démon- 
tré, existe et est unique. 

Comme le schéma compact, la méthode de la racine carrée admet le cal- 
cul du produit scalaire en régime d’accumulation. Ceci étant, on peut 
atteindre une très haute précision si la matrice est bien conditionnée. Dans 
le cas contraire où une matrice est mal conditionnée, les erreurs d’arrondi 
peuvent même violer la propriété de la matrice d’être définie positive et ren- 
dre ainsi impossible la réalisation de l’algorithme. 

6. Décomposition en produit de matrices orthogonale et triangulaire. 
La décomposition de la matrice carrée À en produit de facteurs 


A = QR, (7) 


où R est une matrice triangulaire supérieure et Q une matrice orthogonale 
joue un grand rôle dans les méthodes numériques de l’algèbre linéaire. On 
l'appelle OR-décomposition de À. 

Si la matrice du système d’équations linéaires (1) admet la 
QR-décomposition, le système (1) se réduit au système 


Rx = 'Ob 


à matrice triangulaire, après quoi il peut être résolu facilement par le pro- 
‘cédé décrit à la p. 400. 

L'application de la QR-décomposition à la résolution des systèmes 
d’équations linéaires est justifiée par le fait que le nombre conditionnel de 
la matrice R est égal à celui de la matrice À (comp. p. 386). 

L’une des méthodes de recherche de la QR-décomposition porte le nom 
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de méthode des symétries. On appelle symétrie dans l’espace euclidien , la 
transformation symétrique possédant la valeur propre 1 de multiplicité 
n — let la valeur propre — 1 de multiplicité 1. 

Si à la valeur propre — 1 est associé le vecteur propre s de longueur 1, on 
dira que la symétrie est engendrée par le vecteur s. 

La matrice de la symétrie par rapport à la base orthonormée e, compo- 
sée de ses vecteurs propres est de la forme 


— | 0 ] 0 
P, = : = E —- 2E, ,,avec E, , = | : 
0 ] 0 0 
La matrice P, est othogonale et, par suite, la symétrie est une transfor- 
mation orthogonale, ce qui explique justement l’application des symétries à 
la résolution des systèmes d’équations linéaires. 


Rapportée à une base orthonormée e déduite de e, par une matrice de 
passage orthogonale S, la matrice de la symétrie prend la forme 


P=S"'PS=E- 2STME, 1 S. 
Désignons par €,, et 0; les éléments des matrices respectives E, , et S. L'élé- 


ment de la matrice S”!E, , S situé à l’intersection de la i-ième ligne et de la 
j-ème colonne est alors de la forme 


y Oi Ekt Vi 
k,! 
(il a été tenu compte de ce que S-! = 'S). Tous les €,, sont égaux à 0, à 


l’exception de €,, égal à 1, de sorte que la somme écrite plus haut vaut 0,0, ; 
et 


S7'E, ,S = c'e, 
où & est la première colonne de la matrice 'S. Or'S est la matrice de passage 
deeàe,. La matrice-colonne s est la colonne de coordonnées dans la base e 
du premier vecteur de la base e,, c’est-à-dire du vecteur s définissant la 


symétrie. On voit que dans une base orthonormée la matrice de la symétrie 
est de la forme 


P =E - 20!o, (8) 
où & est la colonne de coordonnées du vecteur définissant la symétrie. 


PROPOSITION 7. Quels que soient le vecteur non nul x et le vecteur f de 
longueur 1, il existe une symétrie que transforme x en af. 


27—6442 
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Notons dès le début qu’on a lal = |xl, car la symétrie est une trans- 
formation orthogonale. Pour fixer les idées, posons que a = lxl. On 
démontrera que la symétrie nécessaire est définie par le vecteur unité s coli- 
néaire à X — œf. 

A cet effet, introduisons une base orthonormée et notons £ et æ les 
colonnes de coordonnées des vecteurs x et f. Déterminons la longueur À du 
vecteur X — jf : 


Ix — afl? =" — opJE — op) = ‘EE — 2a'Ep + a ('p. 
Vu que a° = Ixl? = '£E et ‘@p = 1fl? = 1, il vient 
NX = 1x — afl? = (20° — 2a't@). 


Considérons le vecteur s de colonne de coordonnées À7!(£ — œæ) et la 
symétrie qu'il définit, de matrice 


P=E-— TX -— op)'E — œæ). 
L'image du vecteur x par cette symétrie est 


PE = E — 2174 — op)'E — opX. 
Or 


(Œ — op = EE — à E = 


Donc, PE = £ — £ + aœæget l’on voit que la symétrie obtenue possède la 
propriété exigée. La proposition est démontrée. 


PROPOSITION 8. La matrice carrée À peut être décomposée en produit 
OR, où Q est une matrice orthogonale et R une matrice triangulaire supé- 
rieure. 

Pour le démontrer, posons que l’espace des matrices-colonnes à n éle- 
ments est équivalent à l’espace euclidien rapporté à la base orthonormée 
donnée. En se servant de la proposition 7, on transformera successivement 
les colonnes de la matrice À. 

Si la première colonne de À est nulle, passons à la colonne suivante. 
Dans le cas contraire, on cherche la symétrie qui transforme la première 
colonne de À en une colonne qui est proportionnelle à la première colonne 
de la matrice unité. Soit PU) la matrice de cette symétrie. Alors 


PWA = AU, 
et la matrice A1) prend la forme 
(1) 
a, 45 ai, 
1) (1) 
0 a a, 
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où l'élément «, est égal à la norme euclidienne de la première colonne dans 
la matrice À. 

Supposons maintenant qu'après £ — 1 étapes on a trouvé les matrices 
des symétries Pt), .., P-N telles que la matrice A%K-1N = 
= PEN... PNA d'éléments a!) possède des zéros dans les k — 1 
premières colonnes, au-dessous de la diagonale principale. 

A la £-ième étape on construit la symétrie qui transforme la colonne 

Te ONG us en | (9) 


k-1 


en k-ième colonne de la matrice unité. Ces deux colonnes ont des zéros aux 
k — 1 premières places. Il en est donc de même de la colonne de coordon- 
nées # du vecteur qui engendre la symétrie. Il s’ensuit directement selon (8) 
que les £À — 1 premières lignes et colonnes de la matrice associée à la symé- 
trie ne diffèrent pas des lignes et colonnes homologues de la matrice unité, 
c’est-à-dire qu'elle est de la structure suivante 


pur = és ©] (10) 


Si les n — k derniers éléments de la colonne (9) sont nuls, la symétrie ne 
peut être construite par le procédé décrit plus haut, car le vecteur # devient 
nul. Mais dans ce cas, la colonne de la matrice: À n’a pas besoin d’être 
transformée et la symétrie peut être omise. 

Il est évident qu’en multipliant la matrice (10) par une colonne quelcon- 
que £, on obtient la colonne PAIE dont les # — 1 premier éléments sont 
ceux de £, tandis que les 7 — & + 1 derniers éléments sont indépendants 
des £À — 1 premiers éléments de la colonne £ et s’obtiennent par multiplica- 
tion du bloc P par le tronçon inférieur de la colonne £ qui contient 
n — k + 1 éléments. 

On voit que les # — 1 premières lignes et colonnes de la matrice 


AK) = PU) AKk-1) 


sont les mêmes que celles de la matrice A(%-1) er que de plus la k-ième 
colonne est de la forme 


t (k—1) k—1) 0 
[7% ? ce af, eo Pa Q | 


Ainsi, les éléments de la matrice A(%), situés au-dessous de la diagonale 
principale dans les £ premières colonnes, sont nuls. 

Notons que le produit des symétries est une transformation orthogonale 
qui n’est plus en général symétrique. 

Après la (7 — 1)-ième étape, on aboutit à la matrice triangulaire supé- 


1e 
| 
= 
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rieure A(7-1) qu’on notera R. Si Pt"-1 ... PU = Pet Q = 'P, l'égalité 
R = PUM-D... PU À est équivalente à la décomposition en facteurs (7). 


PROPOSITION 9. Si la matrice À est régulière, sa QR-décomposition dans 
laquelle les éléments diagonaux de R sont strictement positifs est unique. 


DÉMONSTRATION. Soit À = Q,R, = Q,R,. Etant donné que la matrice 
A est régulière, il en est de même de la matrice R,, et l’on peut écrire 


1Q,Q, = RRi!. 


Notons U la matrice R,R; !. Etant le produit de deux matrices triangulai- 
res supérieures, elle est aussi une matrice triangulaire supérieure. U-! est 
également une matrice triangulaire supérieure. Mais en vertu de l’égalité 
précédente, U est une matrice orthogonale, donc U-! = ‘’U est une 
matrice triangulaire inférieure. Cela signifie que U est une matrice diago- 
nale. Or la matrice orthogonale et diagonale ne peut avoir sur la diagonale 
que + 1 ou — 1. Etant donné que les éléments diagonaux des matrices R, et 
R, sont strictement positifs, il ressort de R, = UR, que U = E. La conclu- 
sion nécessaire est maintenant évidente. 

La décomposition en matrices orthogonale et triangulaire, obtenue à 
l’aide de la méthode des symétries, peut être utilisée dans le calcul du déter- 
minant ct de la matrice inverse. En effet, det À = det Q det R. Ici 
det O = (—1)°, où s est le nombre de symétries effectuées, car le détermi- 
nant de la matrice d’une symétrie vaut — 1. Le déterminant de la matrice R 
se calcule directement par multiplication de ses éléments diagonaux. 

Pour trouver la matrice inverse, remarquons que À = QR entraîne 


Ar! = R=!('Q) = R-!lpu-l) pu), 


et tout se réduit à l’inversion de la matrice triangulaire supérieure R. On a 
montré dans la proposition 2 comment on peut inverser une matrice trian- 
gulaire inférieure. La matrice triangulaire supérieure est inversée de façon 
analogue. 

Estimons la capacité de mémoire nécessaire à l’enregistrement de la 
OR-décomposition obtenue par la méthode des symétries. Le produit de la 
matrice d’une symétrie par une colonne quelconque £ peut être obtenu 
d’après la formule (8) : 


PE = E — 20'ot. 


Cela montre qu’il n’est pas nécessaire de mémoriser toutes les matrices des 
symétries. Il suffit de conserver les coordonnées des vecteurs engendrant 
ces symétries, notamment celles des coordonnées qui ne sont pas a priori 
nulles. Ces coordonnées sont pour les n — 1 vecteurs au nombre de 
n+(n-1)+...+2=n(n + 1)/2 — 1. Pour mémoriser les éle- 
ments de la matrice À qui ne se trouvent pas au-dessous de la diagonale 
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principale, il faut réserver n(n + 1)/2 cellules. Ainsi, pour mémoriser les 
deux matrices Q et R, il ne faut que 7 — 1 cellules de plus que pour mémo- 
riser la matrice À. 

7. Méthode des rotations. Le second procédé largement utilisé à la 
recherche de la OR-décomposition est la mérhode des rotations. Pour la 
décrire, considérons dans l’espace euclidien # une base orthonormée 
le,, .….,e, 1. On appelle rotation dans le plan des vecteurs e; et e;(i < j) de 


cette base la transformation dont la matrice 
] 


COS — Sin w 


P = I (11) 
sin w COS 


l 


ne diffère de la matrice unité que par une sous-matrice d’ordre 2 située à 
l'intersection des lignes et colonnes de numéros ; et /. Dans cette transfor- 
mation, le plan des vecteurs e. et e; subit une rotation d’angle &, tandis que 
chaque vecteur du supplémentaire orthogonal de ce plan demeure 
inchangé. Le produit d’une matrice de la forme (11) par une matrice- 
colonne £, est une matrice-colonne dont tous les éléments sont ceux de £, à 
l’exception des i-ième et j-ième qui se transforment suivant les formules 


&' = Éo COS # — E4 sin y, 
E/ = EG sing + Ef cos w. 
Il est évident que quels que soient £f et £4, il existe une rotation pour 


laquelle £ Ÿ = V(EÏY + (£/Pet£/ = 0. Les coefficients dans les formules 
(12) doivent être, dans le cas général, égaux à 


(12) 


cos p = £i/p, sing = —E{/p, 


oùp = VE) + (ESP. Si£i = 0,onacos y = 1,sin y = 0, c’est-à-dire 
que la matrice P est une matrice unité. 

Pour une matrice carrée régulière À on est en mesure de construire une 
suite de matrices de rotation P(), ..…., P(N) de la forme (11) telle que la 
matrice R = PM .…… PA soit une matrice triangulaire supérieure (avec 
éléments non nuls sur la diagonale principale). On voit aisément que cette 
construction est équivalente à la recherche de la décomposition (7). 

La suite des matrices PU), ..…., P(N) contient pour chaque colonne de À 


422 INTRODUCTION AUX MÉTHODES NUMÉRIQUES [CH. XIII 


autant de matrices qu’il y a, dans cette colonne, d’éléments non nuls sous la 
diagonale principale. On posera N = n(n — 1)/2 car, si parmi les élé- 
ments situés sous la diagonale de la matrice À il existe des éléments nuls, les 
matrices de rotation correspondantes peuvent être prises pour des matrices 
unités. 

Considérons la première colonne de la matrice À et choisissons une 
rotation de matrice P() dans le plan des vecteurs e, et e, telle que l’élément 

a() de la matrice A) = P( 4 devienne nul. Ensuite, on effectue la rota- 
tion de matrice PE) dans le plan des vecteurs e, et e,, qui annule l'élément 

a(? de la matrice A® = P® AU), etc. La rotation dans le plan des vecteurs 
e, et e; ne modifie pas les éléments de la colonne dont les numéros différent 
de ] et j et, par suite, les rotations ultérieures ne modifieront pas les élé- 
ments qui ont été annulés par les rotations précédentes. Après 7 — 1 rota- 
tions, on obtient la matrice A(%7-Ù = Ptn-1),,, PU) A4 dont tous les élé- 
ments de la première colonne, à l’exception du premier, sont nuls. 

Les rotations annulant les éléments de la deuxième colonne qui sont 
situés sous la diagonale sont choisies de la même manière dans les plans des 
vecteurs e,, e. pour tous les j = 3, .…, n. Notons leurs matrices P("), 

., PU? - 3), En posant i = 2etj > 2 dans les formules (12), on constate 
que dans ces rotations les éléments nuls de la première colonne demeurent 
inchangés. 

De la même façon, les rotations dans les plans des vecteurs e » €; pOur 
tous les j = m + 1, .…, n permettent d’annuler les éléments ‘situés 
au-dessous de la diagonale dans toute colonne de numéro m < n — 1.Ces 
rotations laissent invariants les éléments situés sous la diagonale dans les 
colonnes précédentes, et ils resteront nuls. 

8. Utilisation du processus d’orthogonalisation. La OR-décomposition 
est intimement liée au processus d’orthogonalisation de Gram-Schmidt. Si 
les colonnes de la matrice À sont linéairement indépendantes, elles consti- 
tuent une base dans l’espace arithmétique :Z ”. Proposons-nous de les 
orthogonaliser. On sait que la première colonne a, devient normée, c’est-à- 
dire est remplacée par g, = p,,4,. La deuxième colonne a, est remplacée 
par la combinaison linéaire q, = p,,4, + p,,a, et, en général, la j ème 
colonne doit être remplacée par 


q; = Pja + .… + pa. (13) 


Les coefficients p;;, sont choisis de manière que les colonnes q; constituent 
un système orthonormé et, par suite, que la matrice Q = lg,, …, q, ll soit 
orthogonale. Considérons les matrices-colonnes 


= ! 
u, = 'p,,, .…., p,, 0, …, ON 


et la matrice U constituée avec ces dernières. U est une matrice triangulaire 
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supérieure et les égalités (13) signifient que AU = Q. Il est évident que 
cette égalité est équivalente à la OR-décomposition avec R = U-!. 

Ainsi, la méthode d’orthogonalisation de Gram-Schmidt peut être utili- 
sée pour obtenir la QR-décomposition. Malheureusement, la stabilité 
numérique de cette méthode n’est pas grande. Les erreurs d’arrondi s’accu- 
mulent de façon qu’en fin de compte la matrice Q obtenue peut s’avérer 
absolument non orthogonale. Il existe des procédés pour améliorer ce pro- 
cessus, mais on les étudiera au $ 3 du ch. XIV. 

9. Comparaison des méthodes et estimation de leur précision. On a étu- 
dié deux approches de la résolution des systèmes d’équations linéaires : la 
méthode de Gauss conduisant à la LU-décomposition et les méthodes des 
symétries et des rotations fournissant la @R-décomposition. Bien appli- 
quée, la méthode de Gauss exige moins d’opérations arithmétiques et une 
capacité moindre de la mémoire vive. Elle fournit aussi une solution plus 
précise au cas d’une bonne sélection de la suite d’éléments principaux ou, 
ce qui revient au même, d’une heureuse mise à l’échelle de la matrice. 

L’unique défaut important de la méthode de Gauss est justement la 
dépendance de la précision du résultat par rapport à la sélection d'éléments 
principaux. Autrement dit, les transformations élémentaires utilisées dans 
la méthode de Gauss modifient la norme de la matrice et il peut s’avérer 
que les éléments de la matrice 4%), obtenus au cours de la résolution, aug- 
mentent fortement en valeur absolue. Cela entraîne l’accroissement du 
nombre conditionnel et la perte de précision de la solution. 

Les méthodes des rotations et des symétries sont assez similaires en pré- 
cision. Comme on le voit d’après les estimations fournies plus bas, cette 
précision est à peu près celle du schéma de division unique, bien qu’elle soit 
moins bonne que la précision du schéma compact à régime d’accumula- 
tion. Notons que le régime d’accumulation est aussi nécessaire à la haute 
précision de la méthode des symétries. 

Quant au nombre d'opérations arithmetiques et à la capacité exigée de la 
mémoire, la méthode des symétries est plus avantageuse que celle des rota- 
tions, et par ces caractéristiques ne cède que de peu à la méthode de Gauss. 

En même temps, les méthodes des symétries et des rotations sont 
exemptes du défaut essentiel de la méthode de Gauss, vu que la multiplica- 
tion par la matrice orthogonale ne change ni la norme spectrale de la 
matrice À ni son nombre conditionnel spectral. 

Les estimations quantitatives des qualités des méthodes étudiées, sur 
lesquelles s’appuie la comparaison donnée, sont étudiées dans le livre de 
Voïévodine [40]. Arrêtons-nous sur l’estimation de la précision de la solu- 
tion. 

Trois grandeurs peuvent caractériser la précision de la solution d’un 
système d’équations linéaires : 
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a) L'erreur, c’est-à-dire Üx = x, — x, où x est la solution calculée.et x, 
la solution exacte (existant théoriquement). On estime habituellement Hôxli 
ou l’erreur relative Îx, — xi/Îx,l. 

b) La matrice-colonne 7 = b — Ax appelée écart défini par la solution 
calculée x. La solution exacte définit un écart nul. L’écart et sa norme 
lb — Axl peuvent caractériser la précision de la solution. On étudie égale- 
ment l’écart relatif b — Axl/lxi. 

c) Selon le principe de l’analyse inverse des erreurs d’arrondi, 
l’influence de ces erreurs sur la solution peut être décrite de la façon sui- 
vante. On peut démontrer que la solution approchée est la solution exacte 
du système d'équations linéaires 


(A + Fjx = b + f. 


La matrice F s’appelle perturbation équivalente de À, et la matrice-colonne 
f celle de b. Les normes des perturbations équivalentes caractérisent la pré- 
cision de la solution. 

Il est plus commode de calculer l’écart, vu que la solution exacte x, nous 
est inconnue, mais c’est surtout l’erreur qui nous intéresse. L'égalité évi- 
dente 


AÔx = b— Ax =7r (14) 


entraîne 
Hôxh < HA -1R "rl. 


Par conséquent, si Ir est petite, il en est de même de lôxi. Mais si 4A-!a 
une grande norme, il faut exiger un très petit écart pour garantir une faible 
erreur. 

L'approche suivante est possible. Si l’écart r est calculé avec une haute 
précision (avec utilisation du régime d’accumulation), la solution calculée 
A x du système (14) sert de bonne estimation de ôx. En outre, x, = x + Ax 
est une approximation de la solution exacte meilleure que x. En calculant 
l’écart défini par x,, on peut obtenir une approximation suivante x,, etc. Ce 
processus sera décrit en détail au paragraphe suivant ; pour le moment, il a 
fallu s’y référer pour noter que la vitesse de convergence de la suite x, x,, 
X,, …… permet de conclure si la matrice À est plus ou moins bien condition- 
née. L’estimation correspondante sera fournie à la p. 433. 

Le calcul des approximations successives n’entraïne pas un accroisse- 
ment sensible du nombre d’opérations et du temps de calcul, car la résolu- 
tion des systèmes de la forme (14) utilise la LU- ou QR-décomposition déjà 
obtenue de la matrice. Aussi s’avère-t-1il parfois rationnel (voir Wilkinson 
et Reinsch [43]) de calculer les approximations successives au lieu de cher- 
cher le nombre conditionnel et, partant, estimer la précision de la solution. 


$ 3] MÉTHODES DIRECTES DE RÉSOLUTION DES SYSTÈMES 425 


Passons maintenant à l’estimation de l'erreur relative. Il nous faudra ici 
se limiter aux formulations. 

Si la LU-décomposition est obtenue par la méthode de Gauss, avec 
choix de l’élément principal suivant la colonne, le produit LU vérifie stric- 
tement l’égalité 


LU=A+G, 
de sorte que 
IGN, < noulAR,, (15) 


où u est une erreur d’arrondi relative à une opération, dépendant de la pre- 
cision du système de calcul utilisé, et p se définit ainsi : si af ) sont les élé- 
ments des matrices À (#) qui se calculent par élimination, on a 


= 3 k — | 
p = 2 (max la DLL | 


Ainsi, » ne peut être défini que si tous les calculs sont effectués. Sous ce 

rapport, c’est une estimation a posteriori. Elle peut être utilisée comme une 

estimation a priori si l’on tient compte de l’expérience des calculs : si la 

matrice est bien conditionnée, max lafo est seulement de quelques fois 
td, J 


plus grand que max la. 
1.) 


Il s’avère que pour les autres décompositions en facteurs déjà rencon- 
trées on est en mesure de mettre une perturbation équivalente sous la forme 
analogue à (15) : le produit de matrices obtenu diffère de À par la matrice 
G dont la norme est majorée par 


IG, < f(n)ulAl,, (16) 


où la fonction f (7) dépend de l’ordre de la matrice À et de l’algorithme de 
décomposition utilisé. 

Pour la LU-décomposition obtenue d’après le schema compact de la 
méthode de Gauss, le terme principal en 7 de la fonction f est une constante 
p°. Tout comme la constante p définie plus haut, b” dépend de la crois- 
sance des éléments dans les matrices 4 (4). Cette assertion est vraie à condi- 
tion que le calcul s'effectue suivant le schéma compact en régime d’accu- 
mulation, et indique que dans ce cas on peut s'attendre à un accroissement 
de précision de n fois par rapport au schéma ordinaire. Remarquons que 
pour le schéma compact appliqué à une matrice définie positive on a 
p = I. 

L'avantage important des méthodes de recherche de la OR- 
décomposition réside dans le fait qu’elles permettent d'estimer f(n7) 
a priori. Plus précisément, pour la méthode des rotations comme pour la 
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méthode des symétries, le terme principal de f(n) est de la forme 2,9n. 
(Pour la méthode des symétries il est obligatoire, comme il a été noté, 
d’agir en régime d’accumulation.) 

On peut montrer que pour toutes les méthodes discutées l’erreur rela- 
tive de la solution calculée vérifie la majoration 


Nx, — xls 


< 2C-(A ; 
FAR CL(A)g(n)u 


où les termes principaux en des fonctions g et f se confondent. 


8 4. Méthodes itératives de résolution 
des systèmes d’équations linéaires 


1. Introduction. Les méthodes directes de résolution des systèmes 
d’équations linéaires, exposées au $ 3 conduisent théoriquement à une 
solution exacte. On s’occupera maintenant des méthodes stératives qui en 
principe fournissent non pas une solution mais seulement la suite qui con- 
verge vers elle. Un terme suffisamment proche de la limite de cette suite est 
pris pour solution approchée. Ainsi, les méthodes itératives possèdent une 
erreur théoriquement nécessaire, ce qui ne constitue d’aucune façon pour 
elles un défaut par rapport aux méthodes directes. En effet, l’erreur men- 
tionnée peut être rendue inférieure à celle due aux erreurs d’arrondi engen- 
drées dans les méthodes directes. Comme on le verra plus bas au point 3, 
les méthodes itératives peuvent être utilisées pour préciser les solutions 
obtenues par les méthodes directes. 

Le point faible des méthodes itératives réside dans le fait que chacune 
d’elles ne converge pas, c’est-à-dire ne définit pas une suite convergente, 
pour tous les systèmes d’équations linéaires. Toutefois, pour une méthode 
choisie il est souvent possible de transformer le système de manière que 
cette méthode devienne convergente. 

L'efficacité d’une méthode itérative est pour une grande part fonction 
de sa vitesse de convergence, c’est pourquoi la vitesse de convergence est 
toujours au centre des préoccupations dans la mise au point de ces métho- 
des. Il est de même caractéristique que l’efficacité des méthodes itératives 
est beaucoup plus grande si on commence par une bonne approximation du 
premier terme de la suite, bien que ces méthodes convergent pour toute 
approximation initiale. 

I] va de soi que la convergence des méthodes itératives n’a lieu que théo- 
riquement. À cause des erreurs d’arrondi inévitables, les approximations 
calculées diffèrent quelque peu des vraies valeurs. Aussi ne peut-on pas 
affirmer que les approximations calculées de numéros suffisamment 
grands se trouvent dans un voisinage aussi petit que l’on veut de la solution 
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exacte. On peut dire seulement qu’elles appartiennent à son voisinage dont 
les dimensions sont définies par la précision des calculs. Lorsqu’une 
approximation tombe dans ce voisinage, les calculs ultérieurs ne peuvent 
plus augmenter la précision du résultat. 

Le domaine type d'application des méthodes itératives sont les systèmes 
d’équations linéaires apparaissant lors de résolution numérique des équa- 
tions aux dérivées partielles. Ce sont en général des systèmes qui comportent 
un grand nombre d’équations à plusieurs inconnues, dont les matrices ne 
peuvent être écrites et traitées que grâce à leur structure spéciale. Or la 
structure spéciale des matrices est généralement altérée par les transforma- 
tions qu’elles subissent dans les méthodes directes. Les méthodes itératives 
sont exemptes de ce défaut. 

Plusieurs méthodes itératives (appliquées non seulement aux systèmes 
d’équations linéaires) peuvent être obtenues d’après le principe du point 
fixe (ou principe des applications contractantes). Donnons sa formulation. 

Soit un espace vectoriel normé complet et soit F une application (pas 
forcément linéaire) de / dans lui-même. On dit que F est une application 
contractante sur l’ensemble .# © _/ s’il existe un nombre à € [0, 1[ tel que 
pour tous x ” et x” de .#est satisfaite la condition 


DF(x) — FX S olx° — x "1. 


Remarquons que cette définition est applicable aussi lorsque F est définie 
non pas sur tout l’espace _/ mais seulement sur l’ensemble .#. 


THÉORÈME 1. Soit .# un ensemble borné fermé dans _/ et soit F une 
application contractante sur .#. Alors l'équation 


x = F(x) (1) 
admet dans .# une solution et une seule. 


Vu qu’on n'aura pas l’occasion d’utiliser cette formulation générale, on 
n’en donnera pas la démonstration. Le lecteur pourra la trouver, par exem- 
ple, dans le livre de Fédoriouk [9]. La démonstration s’appuie sur le fait 
qu’une fois les conditions du théorème remplies, toute suite de vecteurs 
[x,} de .#, définie par la formule de récurrence 


Xk+1 = FC) (@) 


converge vers la solution de l’équation (1). 

2. Méthode itérative simple. Il est le plus simple de mettre le système 
d’équations linéaires Ax = b sous la forme (1) par l’addition de x aux deux 
membres de l'égalité : 


x=x—-Ax +b=(E — A)x + b. 


On obtient une formule plus générale si au préalable on multiplie les deux 
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membres de l'égalité par une matrice régulière H : 
x =x + H(b — Ax), 


ce qui permet de construire le processus itératif défini par la formule de 
récurrence 


Xy41 = Xe + H(b — Ax,). (3) 


En introduisant le paramètre 7 et en désignant H par 7B 7 !, on peut mettre 
la formule (3) sous la forme 


B “Ets + Ax, = b. (4) 
La recherche de la solution approchée avec utilisation de la formule (3) est 
appelée méthode itérative simple ou méthode stationnaire. La formule (4) 
correspond à la méthode stationnaire implicite générale. La valeur du para- 
mètre 7 est choisie pour le système concret de manière que la vitesse de con- 
vergence soit maximale. 
On peut donner aux formules (3) (resp. (4)) la forme 


Xe, = PXx, + f, (S) 


en posant P = E — HA etf = Hb (resp. P=E-7rB"'Aef = rB"'b). 

Supposons que le système Ax = b est compatible et que x" est sa solu- 
tion. Retranchons x * des deux membres de l'égalité (5). Compte tenu de ce 
que f = HD = HAx", il vient 


Keys — X = P(x, — x*), 
d’où en notant d, = x, — x* pour tous les £ = 0,1,...,ona 
d, — P'd,;. 


Il n’est pas difficile de démontrer que la suite {d, } converge pour tout d, (et 
par suite, il en est de même de {x, } pour tout x,) si et seulement si converge 
la suite des puissances de la matrice P. En effet, si P* — ©, il existe pour 
tout €” > O un numéro K, à partir duquel IP* — QÙ < &’, et partant, 
pour tout d, 


Il ne reste qu’à choisir e” = eld 7! pour une > O arbitraire. 

Inversement, si la suite de P“d, converge pour tout d,, en choisissant 
pour d, les colonnes de la matrice unité, on peut montrer que les suites 
{p 9), où p {) est la i-ième colonne de la matrice P*, convergent pour tous 
lesi = 1,...,n. Donc, la suite des puissances converge au sens de la con- 
vergence en éléments. 
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On a vu que d, — D, où Q = Jim P* et, par suite, la limite x de la 


suite {r,| vérifie la relation 
x — x° = Qi. 


D'autre part, il est évident que x est la solution du système et par suite, 
Qd, vérifie le système homogène associé, c’est-à-dire que AQ, = 0. Cette 
condition est satisfaite pour tout d, si 


AQ = 0, 


et seulement dans ce cas. On peut maintenant démontrer l’assertion qui 
suit. 


PROPOSITION 1. Posons que la matrice À du système d'équations linéai- 
res Ax = b est régulière. Dans ce cas, la suite de colonnes définie par la 
formule de récurrence (5) converge pour tout vecteur initial x, si et seule- 
ment si le rayon spectral de la matrice P est strictement inférieur à l'unité. 


DÉMONSTRATION. Les raisonnements précédents montrent que pour 
une matrice régulière À la suite fx,] converge pour tout x, si et seulement si 
Q = O. Il nous reste à démontrer que P* — O si et seulement si le rayon 
spectral de P est strictement inférieur à l’unité. A cet effet, profitons du 
théorème 2 du $ 3, ch. XII. Appliquée à la fonction f&) = £“ et à la 
matrice P, la formule (15) du $ 3, ch. XII, prend la forme 

$ mi d' 
P* = ) dx" AZ; 
=) J=! 
où Z;; sont les matrices composantes de la matrice P, s désigne la quantité 
de nombres caractéristiques distincts, et "1; la multiplicité du i-ième nom- 
bre. Il en ressort immédiatement en vertu de l’indépendance linéaire des 
matrices composantes la proposition nécessaire. 

REMARQUE. La démonstration de la proposition 1 montre que le pro- 
cessus itératif est d’autant plus rapide que le rayon spectral de la matrice P 
est plus petit. 


PROPOSITION 2. Si IP < 1, {a suite récurrente définie par la formule (S) 
converge pour tout vecteur initial non moins vite que la somme de la pro- 
gression géométrique de raison H PH. 


Le fait que la condition I PI < 1 est suffisante pour la convergence de 
la suite considérée découle directement de la proposition 1 si l’on se sou- 
vient de la majoration du rayon spectral de la matrice (proposition 1, $ 4, 
ch. XII). On donnera une autre démonstration permettant d’estimer la 
vitesse de convergence. Si l’on désigne pour £ quelconque d, = 
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= X, — X,_,, il est facile de constater que x, = x, + d, + . + d,. 
Donc, 


x = Jimx, = Xo + Ÿ de. 
k=1! 

Supposons que dans .#, est choisie une norme compatible avec la norme 
matricielle. En utilisant le critère de Cauchy, il n’est pas difficile de démon- 
trer que, pour qu’une série soit convergente, il suffit que converge la série 
des normes de ses termes. Pour d, on a d, = Pd,_,, d’où 
Id,Ü < IPl-Nd,_,h et, dans le cas de I PI < 1, pour la série des normes 
est vérifié le critère de d’Alembert. Ainsi donc, la vitesse de convergence de 
la suite {x, | est dans ce cas supérieure ou égale à celle de la somme de la 
progression géométrique de raison N PA. La proposition est démontrée. 

On a parlé plus haut du rayon spectral de la matrice comme d’une gran- 
deur bien déterminée. En réalité, si les opérations arithmétiques s’effec- 
tuent avec arrondissement, le rayon spectral, comme nombre d’autres 
grandeurs, ne peut être déterminé de façon précise. En effet, soit un nom- 
bre À tel que la matrice P — XE est quasi singulière. Le nombre À se com- 
porte dans tous les calculs de la même façon que le nombre caractéristique. 
En particulier, si À > 1, la méthode itérative simple de matrice P ne con- 
verge pas avec la précision exigée. 

Dans tous les cas, pour accélérer la convergence, le processus doit être 
reglé de manière que la norme de la matrice P soit la plus petite possible. Si 
l’on revient aux formules (3) (resp. (4)), cela signifie qu’il faut choisir la 
matrice H (resp. le paramètre 7 et la matrice B) de manière que la norme 
UE — HA (resp. lE — B-'7A1) soit la plus petite possible. 

Si on avait pu poser À = À -!, le processus (à condition d'exécution 
précise des opérations) aurait convergé en une itération. En utilisant les 
propriétés de la matrice donnée À, on choisit, dans les différentes métho- 
des itératives, les matrices qui, d’une façon ou autre, se rapprochent de 
AT. 

La méthode de Jacobi bien connue se rapporte aux systèmes dont les 
matrices possèdent une diagonale principale dominante (voir $ 4, ch. XII). 
Notons D la matrice diag (a,,, ..., a,,), c’est-à-dire la matrice diagonale 
dont les éléments diagonaux sont égaux aux éléments homologues de la 
matrice À. La méthode de Jacobi est définie par la formule (3) où 
H = D”. Selon la proposition 1, la suite construite d’après cette méthode 
converge si et seulement si le rayon spectral de la matrice E —- D='A est 
strictement inférieur à l’unité. 

Montrons que pour la convergence de la méthode de Jacobi il suffit que 
A possède une diagonale principale dominante. Pour cela, estimons la 
c-norme de la matrice E — D”'A. Cette matrice a sur la diagonale princi- 
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: 2: : a. 
pale des zéros, et ses éléments non diagonaux sont a, = — -k, Donc on a 


LE — D-'AN = max le, | = max » 
0 { 
k kzs:! 


Si À a une diagonale principale dominante, chacune de ces sommes est 
strictement inférieure à l’unité, de sorte que ÎLE — D7'AN < 1. 

L'utilisation d’autres normes fournira des conditions suffisantes diffé- 
rentes. 

Une série de méthodes itératives simples spéciales est liée à des matrices 
symétriques définies positives. Pour toute matrice À de ce genre on peut 
toujours trouver une matrice H pour que le processus itératif (3) converge. 
En effet, les nombres caractéristique de À sont compris dans un intervalle 


a; 
Gix_ 
a;; 


]0, æf. En posant H = : E, on obtient la matrice P = E — e À, dont les 
(0 4 (0 4 


nombres caractéristiques appartiennent à l’intervalle ]— 1, 1[. En effet, si 
A = S-'A'S, où ÀA° = diag (À, …, À,),ona P = S7!P'S, où P'est la 
matrice diagonale avec éléments de la forme 1 — : À. sur la diagonale prin- 
cipale. 

On n’exposera pas d’une façon détaillée l’application de la méthode ité- 
rative simple et de la méthode stationnaire implicite générale aux matrices 
définies positives. Cet exposé peut être trouvé dans les livres de Faddeev et 
Faddeeva [8] et de Samarski [34]. 

Notons que le cas d’une matrice symétrique définie positive est assez 
général, car le système compatible Ax = b est équivalent au système 
tAAx = ‘Ab à matrice symétrique définie positive. Toutefois, on a vu à la 
p. 392 que la matrice ‘AA est en général moins bien conditionnée que la 
matrice À. Aussi une telle transformation du système, effectuée pour pou- 
voir appliquer les méthodes itératives, n’est-elle pas d’une grande impor- 
tance pratique. L'intérêt suscité par l’utilisation des méthodes itératives 
dans la résolution des systèmes à matrices définies positives s’explique par 
le fait que ces systèmes sont assez souvent rencontrés dans les applications. 

3. Précision itérative. Supposons qu’en utilisant la méthode de Gauss 
on ait obtenu la LU-décomposition de la matrice À. Les erreurs d’arrondi 
ont altéré le résultat et, par suite, LU # À pour les matrices calculées L et 
U. Dans la méthode stationnaire implicite générale on peut poser B = LU 
et 7 = 1. La formule (4) prendra alors la forme 


LUd,,, =7r,, (6) 


où r, = b — Ax, est le k-ième écart et d,,, = x,,, — x,, la 
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(k + 1)-ième correction. Pour approximation initiale on choisit la solution 
du système LUx, = b et on calcule l’écart correspondant r,. On le prend 
pour colonne des termes constants du système ayant la même matrice LU. 
La solution de ce système est la première correction d,. L’approximation 
suivante x, s'obtient comme x, + d,. Ensuite, on recherche l’écart de cette 
solution r, = b — Ax, et la deuxième correction d, comme solution du 
système LUd, = r,. La deuxième approximation sera x, = x, + d,, etc. 

Si le produit LU est proche de À, la norme Î E — (LU)-!'A Il est petite, 
de sorte que le processus converge très vite à condition que les calculs soient 
effectués de façon exacte. S'ils ont la même précision que la 
LU-décomposition, ils ne donnent aucune précision, car dans ce cas toutes 
les approximations sont aggravées d’une erreur du même ordre que l’erreur 
de l’approximation initiale. 

Pratiquement, cela signifie que si la précision est réalisée par itération, 
les calculs doivent s’effectuer avec une précision double. Comme le montre 
une analyse plus détaillée (voir Forsythe et Moler {10]), la précision est par- 
ticulièrement nécessaire dans le calcul des écarts et dans l’addition des cor- 
rections. Si ces calculs s'effectuent à 2g chiffres près (ce qui peut être réa- 
lisé avec un régime d’accumulation) et les autres calculs à g chiffres près, la 
précision itérative permet d’obtenir une solution exacte, arrondie jusqu’à q 
chiffres. 

Montrons que la convergence de la précision itérative est fonction du 
conditionnement de la matrice À et de la précision de la décomposition 
obtenue. Supposons que le produit des matrices calculées L et U vérifie 
l'égalité LU = À + G. Alors, 


(LU)Y-'A = (4 + GY'A =(E + A-!G)!. 
En posant que 4 -!I-IGH < 1, on peut représenter cette matrice sous la 
forme d’une série 
E- A=-1G +(A4-!'G} — … 
Pour la matrice E — (LU)-'A dont dépend la convergence, on obtient la 
série 
A°1G-(A-!'GR + … 
Chaque somme partielle de cette série ne dépasse pas en norme la somme 
partielle correspondante de la série des normes, et l’on obtient 
A -!I-UGI 
1 — NA-UU-NGN 


Selon la formule (15) du $ 3,1G1, < 81 A1, ,où 8 = nou. Donc, pour la 


LE — (LU)Y-!'AN < 


$ 4] MÉTHODES ITÉRATIVES DE RÉSOLUTION DES SYSTÈMES 433 


convergence du processus de précision itérative, il suffit que 
__ 6c£(4) 
1 — 0c,(A) 


On a déjà supposé que A -11-IGI < 1, c’est-à-dire que 6c,(4) < 1. 


Avec cette hypothèse, la condition précédente signifie que 6c.(4) < _ 


Ainsi donc, on a démontré la 


PROPOSITION 3. Le processus de précision itérative converge si (dans les 
notations du point 9, $ 3) 


2npuc(A) < 1. 


La précision itérative est assurément possible si au lieu de la 
LU-décomposition, est donnée une autre, par exemple la 
OR-décomposition. 

4. Méthode de Seidel. Dans la méthode stationnaire implicite générale il 
est important que la matrice B Soit facilement inversible. Choisissons donc 
une matrice triangulaire. Si les éléments diagonaux de la matrice À sont 
différents de zéro, la matrice triangulaire inférieure 


a, O0 …… 0 
L _ G;, a, 0 
a, a,» … €, 


(déduite de À par substitution des zéros aux éléments situés au-dessus de la 
diagonale) est régulière. La méthode de Seidel consiste dans la mise en 
œuvre de la formule (4) pour 7 = 1 et B = L, c'est-à-dire de 


L(x,,, — x) + Ax, = b, 


ou 


Lx,,, + Ux, = b, (7) 


où la matrice U = À — L diffère de À par le fait que les éléments situés 
sur et sous la diagonale sont remplacés par des zéros. La formule (7) per- 
met de calculer facilement x, , , d’après x,. 

Selon la proposition 1, la méthode de Seidel converge si et seulement si 
tous les nombres caractéristiques de la matrice E — L-!'A = —-L-1U 
sont en module inférieurs à l’unité. On vérifie aisément que ces nombres se 
confondent avec les racines de l’équation 


det (U + ÀL) = 0. (8) 


28—6442 


434 : INTRODUCTION AUX MÉTHODES NUMÉRIQUES (CH. XHI 


PROPOSITION 4. Pour que la méthode de Seidel converge il suffit que la 
matrice À soit symétrique et définie positive. 


Cette proposition est un cas particulier de la proposition 6 qu’on 
démontrera plus loin. 

La méthode de Seidel converge plus vite que la méthode de Jacobi et 
exige une mémoire de moindre capacité. Cette dernière circonstance est liée 
au fait qu’avec l’utilisation des matrices triangulaires le calcul de la ;-ième 
composante du vecteur x, ,, rend inutile la composante homologue du vec- 
teur x, (voir formule (7)). 

Au point suivant, on étudiera un procédé qui fait accélérer la conver- 
gence de la méthode de Seidel par introduction d’un paramètre. 

S. Méthode de relaxation supérieure. Subdivisons la matrice À en trois 
matrices À = L + D + U. La matrice D est comme plus haut égale à 
diag(a,,, …, a,,) et Let U se déduisent de À par substitution des zéros aux 
éléments a, pour i > k et i < k respectivement. Ainsi, la matrice L du 
point précédent vaut L + D. Supposons que det D + 0. La méthode de 
relaxation supérieure se définit par la formule (4) à condition que 7 = wet 
B = D + wL. La formule (4) prend la forme 


(D + wL)(x,,, — x,) + wAx, = wb, 
ou 
(D + wL)x,,, = [( — w)D — wU]x, + wb. (9) 
Pour w = lonentire la formule (7) traduisant la méthode de Seidel. 


En appliquant la proposition 1, on voit que la méthode de relaxation 
supérieure converge si et seulement si le rayon spectral de la matrice 


P=E-(D + wL) lwA 
est strictement inférieur à l’unité. La matrice P peut prendre une autre 
forme 
(D + wL)-'[( — w)D — wU]. 

L’équation caractéristique de la matrice P peut être transformée de la 
façon suivante : 
det (P — XE) = det (D + wL)”! det [(1 — w)D — wU — X(D + wL))]. 
D'où l’on voit que les nombres caractéristiques de la matrice P se confon- 
dent avec les racines de l’équation 

det [(1 — w)D — wU —X(D + wL)] = 0. (10) 


Portons dans l’équation (10), au lieu de la variable \, la variable £ liée à 
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À par la relation 


Nat, 
E — ] 
On voit aussitôt que la condition IAI < 1 est équivalente à la condition 
Re £ < O0 et que l’équation (10) se met sous la forme 


det [—-wAË — (2 — w)D + w(U — L)] = 0. (11) 
On a ainsi obtenu la 


PROPOSITION S. La méthode de relaxation supérieure converge si et seu- 
lement si les parties réelles de toutes les racines de l'équation (11) sont stric- 
tement négatives. 

Cela permet d’obtenir la condition suffisante suivante. 


PROPOSITION 6. Pour que la méthode de relaxation supérieure soit con- 
vergente il suffit que la matrice À soit symétrique et définie positive et que 
w € ]J0, 2]. 

Pour le démontrer, écrivons l’équation (11) pour une matrice symétri- 
que À et considérons la racine £, de cette équation. Il existe pour £, une 
matrice-colonne non nulle (en général, complexe) x telle que 


[—-wA£, — (2 - w)D + o(U — Ljjx = 0, 
et par suite, 
— wE/xAx — (2 — w)/xDx + w'x(U — L)x = 0. (12) 
La matrice U — L est symétrique gauche et l’on a pour elle 
Ix(U— L)x ='(—'x(U— Lx) = —-'x(U— Lx = —'x(U — Lx. 


Aussi le dernier terme dans l'égalité (12) possède-t-il la partie réelle nulle. 
On démontre de façon analogue que ‘x Ax et ! x Dx sont réelles. En outre, si 
A est définie positive, tous ses éléments diagonaux sont strictement posi- 
tifs, et la forme quadratique ‘x Dx est aussi définie positive. En annulant la 
partie réelle de (12), on obtient 


RE ee. (13) 


Si w € ]0, 2[, on a (w — 2)/w < 0. Il en découle que Re £, < 0. La propo- 
sition est démontrée. 

La proposition 4 s'ensuit comme un cas particulier pour w = 1. 

La formule (12) permet d’exprimer quelques considérations sur le choix 
du paramètre w dans le cas d’une matrice À symétrique définie positive. 
Supposons que les racines de (11) sont réelles et mettons (13) sous la forme 
£, = —ap, où à = (2 — w)/w et p = ('xDx)/('xAx). A la valeur de 
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À = Ocorrespond la valeur de £ = — 1. On doit choisir « de manière que £ 
soit le plus rapproché possible de — 1. 

Estimons p». On peut à cet effet se servir du résultat obtenu dans le $ 2 
du ch. XI, d’après lequel » est compris entre les racines minimale et maxi- 
male de l'équation det (D — XA) = 0. Notons ses racines respectivement 
p, et p?,. Alors toutes les racines de l’équation (11) sont comprises entre 
— ap, et —aæp,. Pour rapprocher ces bornes de — 1, on doit choisir æ de 
manière que le plus grand des nombres 11 — æp,l et 11 — œp,l soit mini- 
mal. Ceci est équivalent à l’exigence que soit minimal le plus grand des 
nombres læ — p; let læ — p; "1. Cette dernière condition sera remplie si 
@ est le milieu du segment [o; !, p; !]. Ce choix de « n’est pas le meilleur 
mais il fournit des résultats acceptables. Le problème de la recherche du 
meilleur « est résolu sous forme générale mais cette résolution est assez 
compliquée et on n’y s'arrêtera pas. 


8 5. Calcul des vecteurs propres et des valeurs propres 


1. Remarques préliminaires. Dans le présent paragraphe on étudiera le 
problème de recherche des solutions non nulles du système d’équations 


AX = ÀX, 


qu’on appellera par abus de langage vecteurs propres de la matrice À. Le 
problème peut être posé de deux façons différentes la recherche de tous les 
nombres caractéristiques et des vecteurs propres associés, ce qu’on appelle 
problème complet des valeurs propres, et la recherche d’un seul ou de 
quelques-uns des ces derniers, appelée problème partiel des valeurs pro- 
pres. 

11 va de soi que le problème des valeurs propres, aussi bien complet que 
partiel, est beaucoup plus compliqué que le problème de résolution du 
système d’équations linéaires, étudié plus haut. Parmi le grand nombre 
d’algorithmes proposés pour sa résolution, il n’en existe aucun qu’on 
puisse recommander dans tous les cas, bien que certains d’entre eux peu- 
vent être dégagés parmi les autres par leur plus grande efficacité. Quelques 
algorithmes sont particulièrement efficaces dans des cas spéciaux, par 
exemple, sont spécialement adaptés aux matrices symétriques ou en ban- 
des. 

Toutes les méthodes existantes de résolution du problème des valeurs 
propres peuvent être divisées en deux grands groupes : les méthodes direc- 
tes qui se basent sur la résolution de l’equation caractéristique et les métho- 
des itératives. Dans les méthodes directes, une étape importante est la 
recherche des coefficients du polynôme caractéristique, vu que leur calcul 
d’après les formules générales, directement déduites de la définition, exige 
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un très grand nombre d’opérations arithmétiques. Les calculs nécessaires à 
la recherche du polynôme caractéristique sont d’habitude utilisés pour 
obtenir les vecteurs propres. Le résultat obtenu par les méthodes directes 
est en principe approché (même si on néglige les erreurs d’arrondi) car les 
racines d’un polynôme caractéristique ne peuvent être trouvées que d’une 
façon approchée. On n’exposera pas ici les méthodes directes de résolution 
du problème des valeurs propres. Elles sont exposés dans les livres de Gant- 
macher {12], de Faddeev et Faddeva [8]. 

La méthode itérative typique est la méthode des rotations, ou méthode 
de Jacobi. La matrice symétrique initiale À est soumise à une série de trans- 
formations de rotation, étudiées au $ 3 avec la construction de la 
‘OR-décomposition. A la différence de la Q@R-décomposition, la transfor- 
mation s'effectue à chaque étape suivant la formule 


(K+1) — — À (K) 
A . T;,14 Tes 


où A!#) est une matrice obtenue après la £-ième étape, et 7, ,, une matrice 
de rotation. Cette formule ne permet pas en un nombre fini d’étapes de 
réduire la matrice à la forme pour laquelle les nombres caractéristiques 
puissent s’établir directement. La (4 + 1)-ième rotation est choisie de 
façon à annuler le plus grand en module élément non diagonal de la matrice 
A%), ou si c’est difficile, tout élément supérieur à un certain nombre 
donné. En d’autres variantes, on diminue la somme des carrés d’éléments 
non diagonaux ou, en général, une norme quelconque de la matrice À(#) 
obtenue à partir de A (%) par substitution des zéros aux éléments diagonaux. 

En fin de compte, après un nombre suffisant s d'étapes, la matrice À 5) 
s’avère proche de la matrice diagonale et possède les mêmes nombres carac- 
téristiques que A. Les éléments diagonaux de A) sont pris pour des 
valeurs approchées des nombres caractéristiques et les colonnes de la 
matrice T = T, . T,, pour des vecteurs propres approchés. 

On ne s’arrêtera pas davantage sur la méthode de Jacobi. Remarquons 
qu’à cause de l’énorme quantité de travail qu’elles exigent, cette méthode 
ainsi que les autres méthodes itératives n’ont subi une grande extension 
qu’après l’apparition des ordinateurs. C’est une des méthodes les plus effi- 
caces pour des matrices symétriques. 

2. Méthode des puissances. Cette méthode s’applique à la résolution du 
problème partiel des valeurs propres. Dans la plus simple des variétés 
(méthode des puissances directe sans décalages) on construit à partir d'un 
vecteur arbitraire x, une suite de vecteurs x,, x,, … tels que 


AXy = Yysp  Xk+1 7 Aa ks (1) 


le facteur strictement positif æ, , , étant choisi de manière que x, , | = 1. 
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Il va de soi que la même suite peut être définie par la formule 
B,x4 = A°X;, (2) 


Où 6, = @œ,... @,. 

Le choix entre les expressions (1) on (2) est dictée par l’économie du 
nombre d'opérations arithmétiques. Généralement, on utilise la formule 
(1) car pour obtenir, disons,'x, par la formule (2) il faut multiplier ñ + 1 
fois la matrice À par la matrice-colonne, tandis qu'avec la formule (1), 2 
fois suffisent. Toutefois, pour de grandes puissances, la calcul successif de 
A1, A*, A3, … permet d’obtenir le résultat par la formule (2) en un moins 
grand nombre d’opérations. 

Supposons que parmi les nombres caractéristiques de la matrice À il 
existe un nombre réel À, dépassant en module tous les autres. A cette condi- 
tion, on peut démontrer que la suite construite est convergente. Ecrivons la 
décomposition spectrale de À “ suivant la formule (15) du $ 3, ch. XII. On 
obtient 


B,x4 ‘= S D UD Z;x0 (3) 
lat J= 
où m1; sont les multiplicités des racines X, du polynôme minimal et Z;; les 
matrices constantes appelées matrices composantes. Divisons les deux 
membres de l'égalité par k‘i-! À. Il vient alors 


VX = S ) Vi Zi Xo (4) 
12 = 


où y, = B,k=%*'Ar4. En effectuant la dérivation, on peut mettre les 


coefficients Ve; SOUS la forme suivante : 
_kK(K—-D..(Kk-j+2 (à 2" 
PR RER A SET ER, x, ; 


Pkij : KT IN! 


Pour 


À, . — , 
HA < 1,ilest évident que »,;; — 0 pour £ — œ. Pour i = 1, avec 


j < 5,, on a de même »,,; — 0, mais cette fois parce que la puissance de K 
dans le numérateur est strictment inférieure à s, — 1. Le coefficient »,,, a 


une limite finie non nulle qu’on notera u. Donc, pour # — © 


m Si 


y L Ve Zÿ X — hZis Xo- 


iml joli 


On voit que pour tour € > 0 et tout £ > K,(e), on a 
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d’où on obtinet sans difficulté 
lu, x — € < Hysx,l < TuZ,, xl + € 
et, comme ly,x,, = y,lx,, = y, 


Dans le cas général, Z,, x, # 0, et par suite, la limite + de la suite y, n'est 
pas égale à zéro. D'où 
LU 
Xk4+1— à Zis Xo- 
A l’étude du cas Z,,x, = 0 on reviendra un peu plus tard. 
Pour une suite convergente {y,}, le rapport y,/y,_, tend vers 1, de 
sorte que 


Yk-i À, k 
entraîne que œ, — À,. Les égalités (1) peuvent être écrites sous la forme 
AX y = Os iXgs 


En passant à la limite on voit que x, tend vers le vecteur propre associé à la 
valeur propre À.. 


D'ailleurs, en se souvenant de la définition des matrices composantes, 
on remarque immédiatemant que dans le cas où Z, 5% CSt différent de zéro, 


il est le vecteur propre associé à N.. 

Considérons de façon plus détaillée le raisonnement qu ‘on vient de 
faire. Chaque terme de la somme (3) tend vers 0 ou vers œ pour À — ©, ce 
qui est dû à son « ordre » k/—!X%. On a imposé la restriction IÀ,1 > IX, 
(i > 1). Dans le cas général, il peut arriver que plusieurs termes de la 
somme aient le même ordre. La suite de x, converge alors vers une combi- 
naison linéaire de vecteurs propres associés à ces termes. 

Pour les matrices réelles, l'hypothèse que le nombre caractéristique 
module maximal soit réel est très importante. La méthode des puissances 
permet de trouver les nombres caractéristiques complexes et les sous- 
espaces invariants correspondants pour les matrices réelles, mais on ne 
s’arrêtera pas sur cette question. 

Discutons maintenant le cas où le vecteur initial x, est choisi de manière 
que Z,,x, = 0. Dans ce cas, le terme de la somme (3) dont l'ordre est 


maximal s’annule. En modifiant le raisonnement, on devra diviser les deux 
membres de l’égalité (3) par l’ordre maximal des termes non nuls. Pour le 
reste la démonstration sera la même et on verra que la suite de x, tend vers 
le vecteur propre correspondant au terme dominant. En particulier, il peut 
arriver que ce vecteur propre soit associé à une autre valeur propre. 


440 INTRODUCTION AUX MÉTHODES NUMÉRIQUES [CH. XIII 


Cependant en réalité, l'égalité Z,, x, = 0 ne peut être vérifiée exacte- 
ment. Même si elle se vérifiait, les erreurs d’arrondi aux premières itéra- 
tions engendreraient un effet équivalent à sa perturbation. Par suite, dans 
le cas considéré, la suite de x, peut assurément converger vers le vecteur 
propre associé au nombre caractéristique de module maximal. Il est possi- 
ble que cela ne se produise pas si les erreurs d’arrondi sont petites et la suite 
converge rapidement. 

3. Méthode des puissances inverse. Les autres variantes de la méthode 
des puissances utilisent le même processus qui s’applique non pas à la 
matrice initiale À mais à une fonction de cette matrice. Considérons une 
variante largement appliquée qu’on appelle méthode des puissances inverse 
avec décalage. Dans ce cas, à la place de la matrice À on utilise la matrice 
(A — pE)-!. On peut évidemment ne pas calculer la matrice inverse et 
construire la suite d’après les formules 


X4 = @p41(À — PE)x,,;, 6) 


en résolvant le système d’équations linéaires en x, , ,. Ceci étant, on se sert 
de la LU-décomposition ou de la QR-décomposition de la matrice 
A — pE, calculée une fois. 

Les nombres caractéristiques y, de la matrice À — bE sont liés aux 
nombres caractéristiques de À par les égalités u, = (À, — p)”!'. Ainsi, la 
méthode des puissances inverse avec décalage fournit une suite convergeant 
vers le vecteur propre de À qui est associé à celui des nombres caractéristi- 
ques À, pour lequel IX, — pl! est maximal. Ce nombre caractéristique est 
le plus proche du nombre bp. 

On utilise en général la méthode des puissances inverse avec décalage 
quand il faut calculer le vecteur propre d’après la valeur approchée du 
nombre caractéristique. On admet dans ce cas que le décalage est égal à 
cette valeur, et la suite converge très rapidement, peut-être en une seule ité- 
ration. La difficulté réside ici dans le fait que pour un p proche du nombre 
caractéristique À, on est obligé de résoudre le système dont la matrice est 
mal conditionnée. 

Montrons que malgré cette difficulté, le vecteur propre peut être obtenu 
de façon assez exacte s’il n’est pas mal conditionné, et que la valeur propre 
À, est bien séparée des valeurs voisines. 

La précision du vecteur calculé x peut être estimée d’après l’ecart 


vu = (4 — pE)x. 
La norme Ilxll = (‘xx)!/2 du vecteur x sera considérée égale à 1. Alors, 
l’égalité précédente peut être mise sous la forme 


(A — v'x)x = px, 
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d’où l’on voit que x est un vecteur propre exact associé à la valeur propre p 
de la matrice perturbée À — u'x. Si la norme de l’écart est petite, il en est 
de même de celle de la perturbation À = —vu'x. En effet, pour tout vec- 
teur y tel que lyl = 1 on a N(v'x)yf = Hu('xy)l < Iul, l’égalité étant 
réalisée pour x = y. On trouve donc pour la perturbation H 

VAN = sup 1 Hyi = ul. 


ll=l 


La formule (5) peut être écrite sous la forme 


(A — pE)x,., = —"#-. 
41 
Rappelons que a, ,, est choisi de manière que le vecteur x, , , ait la norme 
égale à 1, c’est-à-dire telle que a,,, = I(A — oE)-'x,l. Le vecteur 
x, /a,,, peut être interprété comme l'écart engendré par x, ,, et par suite, 
plus a, ,, est grand, et plus l’écart est petit et moins la perturbation équiva- 
lente H est grande. 

Pour estimer la grandeur à,, rappelons-nous que dans le cas général 
(c'est-à-dire pour le vecteur initial x, ne vérifiant pas une égalité exacte) a, 
tend vers le plus grand en module nombre caractéristique de la matrice 
définissant le processus. Si le décalage » est proche de À, et est éloigné des 
autres nombres caractéristiques de À, le nombre caractéristique de plus 
grand module de la matrice (4 — pE)-! est (À, — p)”!. Ainsi, 


œ, = (A-,)7 O(1), 


et l’on peut s’attendre à de grandes valeurs de a, et, partant, à une petite 
norme de l’écart. 

Cependant aux premières itérations, cette relation limite n’est pas aussi 
importante que le choix du vecteur initial. Montrons que dans le cas d’un 
heureux choix de ce vecteur on peut obtenir un petit écart déjà à la pre- 
mière itération. En effet, on peut admettre que la norme de la matrice 
A — pE n'est pas grande et que le nombre conditionnel 
lA — pEl : I(A — pE)"'A est élevé car I(A — pE)- 1 > e-!,oùe est 
un petit nombre. Dans le cas de la norme spectrale cela signifie qu’il existe 
un vecteur unitaire x, pour lequel 1(A — pE)-!x,l > e”!. C’est le pre- 
mier vecteur de la base singulière de la matrice (4 — pE)”!. Si l’on prend 
X, pour vecteur initial, la norme de l’écart devient strictement déjà après la 
première étape. 

Le raisonnement fait est peu réconfortant vu qu’un bon vecteur initial 
nous est inconnu. Mais il n’est pas si inutile que cela peut paraître. En 
effet, si le système d'équations linéaires est mal conditionné, c’est la com- 
posante de l’erreur en premier vecteur de la base singulière de la matrice 
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inverse qui s’avère la plus grande (proposition 5, $ 2). Par conséquent, si à 
la première itération la solution comporte une grande erreur, celle-ci 
entraîne une diminution de l’ecart à l’itération suivante. 

Discutons la vitesse de convergence de la méthode des puissances 
inverse. Elle est fonction des coefficients dans la décomposition (3) écrite 
pour la matrice (4 — pE)! : 


B,x = y y [CX, = p)-#]U- 0) W:xo. 


tm y=1 
La dérivée [(X, — p)7* JU est égale à (À, — »)7" pour j = 1, et à 


(—1)É&CK + 1)... (K + j — 2) 
(À, Œ p}#+i-i 


pour j > 1. Si bp est proche de }, et que W,,x, # 0, le terme contenant ce 
5— | 
vecteur est dominant et l’ordre de son coefficient est 


(À, _. PS M 


vitesse de convergence se définit par la vitesse à laquelle le rapport 
Se _ D\k+i-1 
k (À, p) "4 


tend vers zéro. On voit que le cas le moins favorable est celui d'existence du 
nombre caractéristique À,., également proche de » et de grande multiplicité 
dans le polynôme minimal. Parfois on peut corriger la situation en variant 
le décalage, maïs si À, et À,. sont très proches l’un de l’autre, cela permet de 
dire que le problème est mal conditionné. 

La vitesse de convergence diminue de même si le vecteur W, x, est petit 


ou égal à zéro. Comme il a été montré plus haut, son annulation n’influe en 
général pas sur le vecteur propre calculé. 

Le vecteur vers lequel converge la suite peut dépendre de l’approxima- 
tion initiale dans deux cas. En premier lieu, s’il existe plusieurs nombres 
caractéristiques différents dont les modules sont égaux et dépassent les 
modules des autres nombres. En second lieu, si au nombre caractéristique 
maximal en module est associé un sous-espace propre de dimension 
m > 1. On décrira un peu plus loin comment obtenir dans ce cas la base de 
ce sous-espace. 

Les erreurs d’arrondi apparaissant à chaque itération comme dans le 
cas de résolution itérative du système d’équations linéaires influent sur la 
convergence du processus. 

Si l’on tient compte des erreurs d’arrondi et que dans l'égalité 
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(A — pE)"!x, = @,,,X,,, On comprenne par x, ,, et x, des vecteurs en 
fait calculés, cette égalité doit être corrigée par un terme complémentaire, 
soit : 


he 
(A — pE) x, = @,x,, + We. 


Tous les vecteurs u, sont bornés : Îu,N < 6, avec ô indépendant de l’itéra- 
tion. Comme plus haut, on peut écrire 


(CA — PE) — us 'xs)xg = ixus 
Cela signifie que le résultat est le même que dans l’itération exacte avec 
matrice perturbée (À — bE)-! + F, où F = —u,'x,. Aussi, à une des 


itérations, peut-il s’avérer que le vecteur x, , , coïncide avec x, en précision 
d’exécution, mais on ne pourra pas affirmer qu'il est un vecteur propre de 
(A — pE)”! (et, par suite, de À), il le sera pour une autre matrice voisine. 
Autrement dit, on ne peut pas garantir que l’amélioration des approxima- 
tions x, se poursuivra après que x, devienne égal au vecteur propre d’une 
matrice (4 — pE)-! = H, où I HI < 6. La précision réellement accessi- 
ble dépend du conditionnement du vecteur propre et de la valeur propre. 

Si la valeur approchée du nombre caractéristique est inconnue a priori, 
la méthode des puissances convergera en principe pour tout décalage (par 
exemple, nul), mais cette convergence sera beaucoup moins rapide. Dans ce 
cas, pour accélérer la convergence, on recourt au décalage qui varie à cha- 
que itération. Pour une matrice symétrique, les meilleurs résultats s’obtien- 
nent si pour décalage on prend le quotient de Rayleigh calculé pour chaque 
vecteur x, . On ne s’arrêtera pas en détail sur ce sujet, comme sur de nom- 
breux autres procédés d’accélération et de précision de la méthode des puis- 
sances. Notons seulement qu'avec toutes ces améliorations la méthode des 
puissances inverse avec décalage s’est avérée la plus précise et efficace pour 
obtenir un ou plusieurs vecteurs propres. 

4. Développement ultérieur de la méthode des puissances. La méthode 
des puissances décrite plus haut permet d’obtenir un des vecteurs propres 
associés au nombre caractéristique maximal en module. Voyons comment 
elle peut être modifiée afin d'obtenir les autres vecteurs propres. 

Soit À une matrice symétrique. Admettons que l’un de ses vecteurs pro- 
pres p est déjà obtenu et normé, de sorte que pi = 1. Si l’on veut cons- 
truire la suite convergeant vers un autre vecteur propre, il est naturel de 
choisir pour vecteur initial un vecteur orthogonal à p. Mais le vecteur x, 
obtenu après la première itération de la méthode des puissances ne sera plus 
orthogonal à p et l’on devra le rectifier. Cela engendre le processus suivant. 
Si le vecteur x, est construit, on pose 


— = ni { = 
Veus = AXps Tu = Yes — P'PYyeur es iXesr = aie 


444 INTRODUCTION AUX MÉTHODES NUMÉRIQUES [CH. XHI 


Le facteur a,,, est choisi de manière que soit remplie la condition 
Ix,,,h = 1.1Ilest facile de voir que x, , , est orthogonal à p. En réunissant 
les égalités précédentes, on obtient 


Ax+1%k+1 = (E — P'P)AX,. 


Ainsi donc, la construction de la suite équivaut à l’application de la 
méthode des puissances de matrice 


B =(E — p'p)A. 


Cela signifie que la suite {x,] converge vers le vecteur propre g de la 
matrice B associé au nombre caractéristique 4, maximal en module de cette 
matrice. 

Pour trouver u,, notons que B a les mêmes nombres caractéristiques 
que À, mais la multiplicité de la racine N, a diminué de 1, tandis que la mul- 
tiplicité du nombre caractéristique nul a augmenté de 1 (ou est apparue une 
racine À = O0 si elle n’existait pas). En effet, considérons une matrice 
orthogonale S dont la première colonne est p, et à l’aide de cette matrice 
formons la matrice B° = S-!1BS. On peut l'écrire ainsi 
[S-!'(E — p'p)SHS-'AS]. Les facteurs renfermés entre crochets sont 
respectivement de la forme 


0 … o N,) O0 … 0 
; 0 
- | 2 et . " 
0 : 
0 
En multipliant ces matrices, on obtient 
0 .… O0 
B'=|: À 


0 
Les ñ — 1 dernières lignes dans la matrice B° sont les mêmes que dans le 
second facteur. En comparant les polynômes caractéristiques des matrices 
À, À et B, on aboutit au résultat exigé. 

Ainsi, y, = À, si la multiplicité de À, dans le polynôme caractéristique 
de la matrice À est strictement supérieure à l’unité ; dans le cas contraire, 
4, est égal au nombre caractéristique de la matrice À, de module immédia- 
tement inférieur. 

On voit aisément que le vecteur g est orthogonal à p. En effet, 


4, ‘pq = ‘pBq = 'p(E — p'p)Ag = 0A4g = 0. 
D'où pour y, # 0, on obtient ‘pq = 0. 


$S] CALCUL DES VECTEURS PROPRES ET DES VALEURS PROPRES 445 


Démontrons que pour une matrice symétrique À le vecteur g sera de 
même son vecteur propre. En effet, le produit d’un vecteur par la matrice 
E — p'p est égal à la projection orthogonale de ce vecteur sur le supplé- 
mentaire orthogonal ./’du sous-espace engendré par p. Aussi l’égalité 
(E — p'p)Agqg = u,g signifie-t-elle que 


Ag = 1,q + ap. (6) 


Il en découle que si .#’est invariant par À (en particulier, pour une matrice 
symétrique), on a Ag = u,gq, ce qu’il fallait démontrer. 

Ainsi, dans le cas de matrice symétrique, la suite de x, converge vers le 
vecteur propre de À, othogonal à p. 

L'application de la méthode des puissances à la matrice B peut être sim- 
plifiée si on réduit B à la matrice B ” indiquée plus haut, dans laquelle la 
première ligne et la première colonne sont nulles. Toute puissance de la 
matrice B ‘est de la même forme et, par suite, tout se réduit à l’application 
de la méthode des puissances à la matrice À d’ordre ñn — 1. On ne s’arré- 
tera pas à la réalisation de cette méthode d’abaissement de l’ordre ainsi que 
sur les autres méthodes semblables appelées méthodes d'exhaustion. 

Supposons maintenant que la matrice À n’est pas symétrique. En opé- 
rant comme il a été indiqué plus haut, on peut construire le vecteur g, mais 
dans la relation (6) le nombre « peut s'avérer différent de zéro. Si la multi- 
plicité de la racine X, est strictement supérieure à 1, il faut pour cela que le 
vecteur p possède le premier vecteur associé. En effet, pour u, = À, et 
œ # 0 la relation (6) peut être mise sous la forme 


(4 — X EX a 'q) = p. 


Il n’est pas difficile de construire un exemple dans lequel g est associé 
au vecteur p construit auparavant. 
Si la racine N, n'est pas multiple, y, # À,, on peut d’après g construire 
le vecteur propre r de la matrice À, associé au nombre caractéristique y. 
On cherchera ce vecteur sous la forme 7 = g + Bp. On vérifie aisément 
que l’égalité 
A(q + Bp) = u,(g + Bp) 


est vérifiée pour 8 = a/(u, — À). 

Supposons que les nombres caractéristiques de la matrice À sont tels 
que IX, I > IX > INT > .…., avec À, et À réels. Pour trouver À, et le 
vecteur propre correspondant on peut profiter alors de la méthode sui- 
vante. Souvenons-nous que chaque vecteur propre de la transformation 
adjointe A* est orthogonal à tous les vecteurs propres de À associés à 
d’autres valeurs propres. En appliquant la méthode des puissances directe, 
on peut obtenir un vecteur unitaire u pour lequel ‘Au = À,u, ‘up = o + 0 
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et ‘ug = 0,oùp et q sont les vecteurs propres de À associés respectivement 
à À, et À. On peut montrer que le processus construit suivant les formules 


—_- — _ { = 
Veau = AXps  Zus = Vesr — M'UYpuus  Cpaidesr = a 


converge vers le vecteur propre associé à À. La démonstration diffère peu 
de celle qui a été fournie plus haut pour la matrice symétrique et on laissera 
au soin du lecteur de la réaliser. 

Revenons au cas de la matrice symétrique À et posons que nous avons 
construit deux de ses vecteurs propres pl) et p@. Le troisième vecteur pro- 
pre de cette matrice peut être construit de façon analogue par orthogonali- 
sation à chaque itération du vecteur Ax, par rapport à pl) et p@). D'une 
façon générale, si on a construit le système orthonormé de s vecteurs pro- 
pres p{1), .…, p(), le vecteur suivant peut être construit d’après la méthode 
des puissances appliquée à la penses 


(z- ) EU) Gp) À, 
is] 

ce qui équivaut à l’orthogonalisation du vecteur Ax, par rapport à tous les 

p'), …, ps). On peut ainsi obtenir une base orthonormée de vecteurs pro- 

pres de toute matrice symétrique. 

Une autre méthode proche de la méthode décrite ne diffère que par:le 
fait que les vecteurs propres de la matrice sont calculés non pas successive- 
ment mais en même temps. Dans ce cas, les vecteurs construits à chaque ité- 
ration constituent les colonnes d’une même matrice, de sorte qu’on cons- 
truit une suite de matrices. 

Le processus correspondant à la méthode des puissances directe sans 
décalage est construit suivant les formules 


APe = Vesrs  Vess = PesiResr (7) 


où P, est une matrice à colonnes orthonormées, et R,,, est choisie de 
manière que soient orthonormées les colonnes de P,, 

Dans la suite de l’exposé, il nous faudra de plus en plus passer sous 
silence certains détails. En particulier, on n’étudiera pas la convergence du 
processus (7). 

Par ce processus, on peut en particulier obtenir un couple de racines , 
et À, complexes conjugées, ainsi qu’un sous-espace bidimensionnel De 
ant correspondant, si ces racines dépassent en module les autres nombres 
caractéristiques. Dans ce cas, les matrices P, sont constituées de deux 
colonnes qui tendent vers les vecteurs de la base orthonormée du sous- 
espace invariant. R, sont les matrices d'ordre deux dont les nombres carac- 
téristiques tendent vers les nombres caractéristiques complexes conjugués 
À, et À, de la matrice A. 
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Si on ne connaît rien sur les nombres caractéristiques de la matrice À, il 
vaut mieux réaliser le processus (7) en utilisant les matrices P, à n colonnes 
orthonormées, c’est-à-dire des matrices orthogonales. Dans ce cas, P,, ,et 
R, , , Peuvent être obtenues par la QR-décomposition de la matrice A*. 

En réunissant les formules (7), on peut, comme dans les cas précédents, 
écrire le résultat de la k-ième itération : 


AtP, = PRR,_ Ri. 


Si l’on débute le processus par une matrice unité et qu’on introduise la 
notation U, = R,R,_,... R,, il vient 


A* = P,U,. 


La matrice U, étant une matrice triangulaire supérieure, la dernière for- 
mule peut être prise pour une QR-décomposition de A“. 

Ce processus permet d’obtenir tous les nombres caractéristiques et, au 
moins pour une matrice symétrique, tous les vecteurs propres, mais en 
général, il revêt une autre forme, beaucoup plus commode. C’est à sa des- 
cription qu’on passe. 

S. OR-algorithme. Cet algorithme s’appuie sur le processus suivant. 
Recherchons la QR-décomposition de la matrice initiale. Soit 4 = Q,R.. 
Posons 4, = R,Q, et cherchons pour la matrice 4, sa QR-décomposition, 
soit À, = Q,R,. On obtient la matrice 4, en permutant les facteurs Q, et 
R,. D'une façon générale, 


A,_, = QR, À, = RQ. (8) 
Ceci étant, R, = Q;'A,_, et par suite, 4, = Q714,_,Q,. D'où 
A, = Q;!'... 95'AQ, … 0, = PS'AP,, (9) 


où P, = Q, … Q,. Cela montre que les nombres caractéristiques de toutes 
les matrices À, coïncident avec les nombres caractéristiques de la matrice 
À. 
Si l’on désigne le produit R, .… R, par U,, la puissance k-ième de la 
matrice À peut être exprimée ainsi : 
A = P,U,. (10) 
En effet, 


P,U, = Q0,..QR,..….R, = Q,...0,_,4,_,R,_,..R, = P,_,4,_,U,_.. 
Or la formule (9) écrite pour 4, _, implique 
Pr-yAy = APe- 


et, par suite, P,U, = AP, _,U,_,. On obtient la formule (10) par applica- 
tion successive de ce résultat, ce qui permet d’établir le lien avec le proces- 
sus décrit à la fin du point précédent. 
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On voudrait affirmer que la suite de matrices À, converge vers une 
matrice triangulaire à blocs, mais ce n’est malheureusement pas le cas. On 
peut seulement démontrer que les éléments de À, situés au-dessous des 
blocs diagonaux tendent vers zéro, tandis que les éléments de ces blocs et 
les éléments situés ci-dessus sont uniformément bornés. La suite de matri- 
ces ayant cette propriété est dite convergente en forme vers la matrice trian- 
gulaire à blocs. 

A ce qu’il paraît, il n’existe pas jusqu’à présent de démonstration de 
cette assertion aussi simple pour qu’on puisse la reproduire ici. 

Pour décrire plus en détail la matrice « limite » 4, obtenue à l’aide du 
QR-algorithme, supposons que les nombres caractéristiques de À sont 
ordonnés de façon que leurs modules forment une suite décroissante : 


IX, = .. _ EN, | > EX, _ = .… 
| Ù 
=, t>.e DIX, =. = IX. 


r + r2 
La matrice À, peut être partagée en blocs correspondant à des groupes de 
nombres caractéristiques égaux en module. On arrive à démontrer que les 
éléments du (;, j)-ième bloc au-dessous de la diagonale tendent pour i > j 
vers zéro non moins vite que 


pe 


À !l& 
x. ). (11) 


où m est la multiplicité maximale des racines dans le polynôme minimal de 
la matrice À (voir Voïévodine [40]). 

Dans la matrice « limite », les blocs diagonaux correspondent aux 
groupes de nombres caractéristiques égaux en module. Ceci étant, les nom- 
bres caractéristiques des blocs se confondent avec les nombres caractéristi- 
ques de la matrice À associés au groupe correspondant. Par exemple, à un 
couple de nombres complexes conjugués À, À de multiplicité 1 correspond 
un bloc diagonal d’ordre deux avec nombres caractéristiques À et À. 

Admettons que la matrice À possède un système complet de vecteurs 
propres et que X est une matrice dont les colonnes sont les vecteurs propres 
de la matrice 4. Notons ©, la matrice orthogonale qui intervient dans la 
OR-décomposition de la matrice X. On peut alors démontrer qu’il existe 
des matrices diagonales orthogonales 7, telles que 7,Q, — ©... 

Cette relation est particulièrement importante pour une matrice symé- 
trique À car elle permet de trouver sa base orthonormée de vecteurs pro- 
pres. 

Habituellement, les dimensions des blocs diagonaux de la matrice limite 
A,, ne sont pas grandes, et les nombres caractéristiques correspondants 
s’obtiennent sans difficulté. Une fois ceci fait, les vecteurs propres associés 
sont recherchés par la méthode des puissances inverse avec décalage. 


o (aan 
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6. Réduction de la matrice à la forme quasi triangulaire. Chaque étape 
du QR-algorithme comporte la recherche de la QR-décomposition d’une 
matrice et la multiplication de matrices, de sorte qu’elle exige un nombre 
considérable d’opérations arithmétiques. On peut faciliter sensiblement les 
calculs si on prépare au préalable la matrice À en la réduisant à la forme 
quasi triangulaire (ou forme de Hessenberg). 

La matrice À d’éléments a, est par définition une matrice quasi trian- 
gulaire supérieure si a; = 0 pour i > j + 1. Ainsi, les seuls éléments non 
nuls situés au-dessous de la diagonale principale sont ceux da la rangée 
parallèle à la diagonale et située immédiatement au-dessous d’elle. De 
façon analogue on détermine les matrices quasi triangulaires inférieures. 


PROPOSITION 1. Pour toute matrice À on peut construire une matrice 
orthogonale S telle que la matrice S-' AS soit une matrice quasi triangu- 
laire supérieure. 

Pour réduire la matrice donnée à une matrice quasi triangulaire supé- 
rieure, on procède à chaque étape à la transformation d’une colonne de la 
matrice à la forme exigée. Supposons qu'après r — 1 étapes la matrice À 
s’est transformée en une matrice A(”) dont les r — 1 premières colonnes 
correspondent à la forme quasi triangulaire supérieure. Alors la matrice 
A+ se déduit d’après la formule 


AU+D = IP AMP, 


où P, est une matrice de symétrie (point 6, $ 3). La matrice de symétrie est 
symétrique et orthogonale : P, = ‘P, = P;!, de sorte que At"*+1) = 
= Prl'AUP.. 

Décrivons comment on choisit la matrice P,. Si dans la r-ième colonne 
de la matrice A() les n — r derniers éléments sont des zéros, on n’a pas 
besoin de transformer cette colonne et on passe à la (7 + 1)-ième colonne. 
Dans le cas contraire, on construit une symétrie qui transforme le vecteur 


u = ‘NO, .…, 0, ) …., QT 


r+1,r’ 


en un vecteur proportionnel à la (7 + 1)-ième colonne de la matrice unité. 
Remarquons que ce choix diffère de celui qu’on a fait dans la construction 
de la OR-décomposition par la méthode des symétries, à savoir : on a subs- 
titué des zéros dans la r-ième colonne à r — 1 premiers éléments et non pas 
à r, après quoi on a transformé la colonne obtenue en une colonne propor- 
tionnelle à la r-ième colonne de la matrice unité. En définitive, on arrive à 
construire la matrice de symétrie P, dont les r premières colonnes et lignes 
se confondent avec les lignes et colonnes respectives de la matrice unité. 

La multiplication à gauche de 4(") par P laisse inchangées les r premiè- 
res lignes de la matrice A(7), ainsi que les éléments nuls des colonnes de 
numéros < 7, mais elle annulle les ñn — (r + 1) derniers éléments de la 
29— 6442 
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r-ième colonne. La multiplication à droite de la matrice par P, ne modifie 
pas ses r premières colonnes et, par suite, la forme du produit à gauche se 
conserve. 

La dernière colonne à transformer est la (7 — 2)-ième. Donc, après 
n — 2 étapes la matrice À sera convertie en matrice quasi triangulaire supé- 
rieure. 


PROPOSITION 2. La forme de la matrice quasi triangulaire supérieure 
reste inchangée par toutes les transformations de la matrice suivant le 
OR-algorithme. 


DEMONSTRATION. Soit À une matrice quasi triangulaire supérieure. Elle 
peut être transformée en une matrice triangulaire supérieure R si on la mul- 
tiplie à gauche par les matrices de rotations dans les plans engendrés par les 
couples de vecteurs de base de numéros (1, 2), (2, 3), (3, 4), 

…, (7 — 1,n). Donc, la OR-décomposition de À est de la forme 


A = 'P;..'P,_,,R 


n—1,n" 
et la matrice À, est égale à 
A, = RQ = R'P,...'P,., 


n n° 


La multiplication à droite par les matrices de rotation mentionnées ne peut 
modifier dans la matrice R que les blocs d’ordre deux qui sont situés sur la 
diagonale et au-dessus d’elle. Dans ce cas, la matrice triangulaire ne peut 
être convertie qu’en une matrice quasi triangulaire. 


PROPOSITION 3. La nature symétrique de la matrice À n'est pas perturbée 
par l'application à cette dernière du QR-algorithme. 


En effet, si À est symétrique et À = OR, on a À = ‘4 = 'R'OQ, d’où 
(R = QRQ. Maintenant si À, = RQ, on obtient ‘4, = 'O'R = 
= ‘(OORQ = AÀ,, ce qu’il fallait démontrer. 

Si la matrice symétrique a été transformée par une matrice orthogonale 
S en une forme quasi triangulaire, la matrice obtenue S-! AS est aussi 
symétrique. Les matrices quasi triangulaires symétriques sont dites tridia- 
gonales. Dans une telle matrice, les seuls éléments non nuls sont ceux de la 
diagonale principale et de deux rangées qui lui sont parallèles et situées tout 
près d’elle, l’une au-dessus et l’autre au-dessous. 

Le OR-algorithme est pratiquement toujours appliqué aux matrices 
quasi triangulaires et, dans le cas de matrices symétriques, aux matrices tri- 
diagonales. 

Remarquons que la OR-décomposition d’une matrice quasi triangulaire 
est obtenue le plus aisément par la méthode des rotations : comme on l’a vu 
en démontrant la proposition 2, il ne faut que #7 — 1 rotations. 

7. Accélération de la convergence du QR-algorithme. L’estimation (11) 
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donnée plus haut montre que la vitesse de convergence du QR-algorithme 
décrit peut s’avérer très faible. On a mis au point des variantes améliorées 
de cet algorithme pour permettre d'augmenter sensiblement la vitesse de 
convergence. 

a) Abaissement de l’ordre. Si au cours de transformations d’une 
matrice quasi triangulaire d’après le QR-algorithme un de ses éléments 
situés au-dessous de la dixgonale s’avère si petit qu’on peut le négliger et 
remplacer par le zéro, la matrice devient une matrice triangulaire à blocs 
diagonaux quasi triangulaires. On obtient tous les nombres caractéristiques 
de la matrice initiale si l’on trouve les nombres caractéristiques des blocs 
diagonaux. Aussi l'apparition des éléments nuls au-dessous de la diagonale 
diminue-t—lle les dimensions du problème à résoudre. 

b) Décalages. Soit une suite numérique {o,] appelée suite de décalages. 
Le QR-algorithme avec décalage est défini par les formules 


A PME = QR, A, = RQ +PLE. 


Il n’est pas difficile de démontrer que dans ce cas À, = ‘P,AP,, où 
P, = Q,... Q,. Ainsi, les nombres caractéristiques de toutes les matrices 
A, coïncident avec les nombres caractéristiques de la matrice À. 

On peut également montrer que 


P,U, = (A — p,E).… (A — p,E). 


On a mis au point une série de critères qui permettent de choisir des sui- 
tes de décalages. On ne les exposera pas. Notons seulement que la plus 
grande accélération est fournie par un décalage proche du nombre caracté- 
ristique de la matrice À. On rencontre des cas où la vitesse de convergence 
est anormalement faible. Il existe également des matrices qui restent inva- 
riantes par toutes les transformations du QR-algorithme (l’unique bloc dia- 
gonal de la matrice limite est confondu avec la matrice de départ). Dans ces 
situations, tout décalage peut s’avérer utile. 

Il existe aussi de nombreuses complications et modifications du 
OR-algorithme avec décalage, adaptées aux différentes situations particu- 
lières, par exemple, à la recherche des nombres caractéristiques conjugués 
complexes d’une matrice réelle. 

8. Estimations a posteriori de la précision des calculs. Si on a calculé 
une valeur approchée de la solution du problème complet des valeurs pro- 
pres, il est possible d'utiliser le résultat obtenu pour estimer sa précision 
dans une large classe de problèmes. On admettra que les nombres caracté- 
ristiques calculés À}, …, À sont différents et que les vecteurs propres cal- 
culés £”, .…, £* sont linéairement indépendants. 

On peut former n vecteurs-écarts 


p, = Afÿ — \'EF. 


20° 
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En désignant par X et P les matrices composées respectivement à partir des 
colonnes £* et p,, mettons ce système d’égalités sous la forme 


AX — XD = P, 
avec D = diag (A*, …, À*). En multipliant par X-!, on obtient 
X=-!'AX = D + X=-!'P. 


Cette égalité signifie que la transformée exacte de la matrice À par X est 
une matrice qui diffère de la matrice diagonale par V = X71P.Si\*et £* 
sont de bonnes approximations, la norme de la matrice P est petite. Si À VA 
est aussi petite, les nombres caractéristiques de D + V peuvent être estimés 
d’après les nombres caractéristiques de D, c’est-à-dire que les nombres 
caractéristiques exacts de À sont estimés d’après leurs approximations cal- 
culées. Cette estimation peut être réalisée par construction des disques de 
localisation (voir $ 4, ch. XII) si les éléments de la matrice F sont calculés 
de façon assez précise. Pour aboutir à la précision maximale, la matrice 
d’écarts P est calculée en régime d’accumulation du produit scalaire, et les 
solutions du système d’équations linéaires, au moyen duquel on obtient les 
colonnes de la matrice V, sont soumises à une précision itérative (point 3, 
$ 4). 

Supposons maintenant qu’on a calculé un seul nombre caractéristique 
À} et le vecteur propre associé £”. Voyons comment on peut estimer leur 
précision. Il est naturel de recommencer par l'écart 


AE; — ME =». 


Sans restreindre la généralité on peut considérer que IE* I? = '£E*£* = 1, 
et mettre l’égalité précédente sous la forme 


(A — PE — p'Et)Et = 0. 


Cela montre que À* est la valeur propre et que £} est le vecteur propre de la 
matrice perturbée À + H,où H = —p'£}. Ceci étant, il n'est pas difficile 
de montrer que À HA = Üpl (voir p. 441). Selon la formule (14) du $ 2, il 
vient 


min IX — Àfl & »(A4)lol. 


Cette estimation est peu utile. D’abord, »(4A ) est inconnu. Il est possible 
de le majorer si l’on trouve les autres vecteurs propres et le nombre condi- 
tionnel de la matrice qu’ils composent. En outre, cette estimation peut 
s'avérer exagérée si la première valeur propre de la matrice est bien condi- 
tionnée et qu'il existe des valeurs mal conditionnées. 

Considérons une autre approche. Soient £/ et #} les approximations 
calculées des vecteurs propres des matrices À et ‘A respectivement et 
soient les vecteurs exacts £, et #, associés à une même valeur propre À,. On 
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admettra que les vecteurs £, et #,sont normés et que les différences 
ÔE, = £} — £, et ôg, = #! — #, appartiennent aux enveloppes linéaires 
des vecteurs £,, ..…,£, et #;, …, #, respectivement (voir p. 394). En vertu de 
cette convertion ‘#jô£, = Oet ô'#,£, = 0. Calculons l’expression 


afAEY L Ca + S'mPJQUE + AGE) _ | | ômi(A — À EE, 
PT s? | si 

où s = ‘Er = 5, + Ô'#,ô£,. On voit que le coefficient calculé s” dif- 

fère de la valeur exacte s, par une grandeur dont l’ordre est le produit 

d’erreurs. Si ce coefficient n’est pas trop petit, l’expression calculée diffère 

très peu de la vraie valeur propre. 

Si la matrice À est symétrique, £,et #, peuvent être pris confondus et 
l’expression (12) devient le quotient de Rayleigh pour la matrice 4. En rai- 
son de ce fait, l’expression considérée est appelée quotient de Rayleigh 
généralisé. Pour les matrices symétriques, le quotient permet de simplifier 
les calculs et d’aboutir à des bonnes estimations théoriques. Dans le cas des 


{ * À # 
MTS four- 


» (12) 


matrices non symétriques on peut seulement dire que, siu = : 
nit, avec #' et £*, des écarts faibles, il est une bonne lon de \,, 
et s} est une bonne approximation de s,. 

La valeur zx du quotient de Rayleigh généralisé peut être utilisée non 
seulement pour estimer l’erreur mais aussi pour préciser le résultat. A cet 
effet, en prenant 4 pour la valeur de décalage, on obtient le vecteur propre 
par la méthode des puissances inverse. 


CHAPITRE XIV 


PSEUDO-SOLUTIONS 
ET MATRICES PSEUDO-IN VERSES 


$ 1. Propriétés élémentaires 


1. Remarques préliminaires. Dans les problèmes pratiques il est souvent 
nécessaire de trouver une solution vérifiant un grand nombre de contrain- 
tes parfois contradictoires. Si un tel problème se réduit à un système 
d’équations linéaires, ce système s’avère généralement incompatible. Dans 
ce cas, le problème ne peut être résolu que par le choix d’un accommode- 
ment : on essaie de vérifier presque toutes les contraintes. Expliquons-le sur 
l’exemple suivant. | 

Supposons que deux grandeurs physiques y et x sont liées dans le 
domaine de leur variation par une dépendance linéaire de la forme y = 
= kx + b et que les coefficients doivent être établis expérimentalement. 
Les données expérimentales sont constituées par m points du plan de coor- 
données : (x,, y), ..., (x, y). 

Si ces couples de valeurs sont en effet liés par la dépendance recherchée, 
en les portant dans l’équation on aboutit à un système de m équations 
linéaires à deux inconnues & et b : 


}, = Kx;, + b, il = 1, .. M. 


Pour tous x; et x; différents, les points (x;, y;) et (x;, y;) définissent une 
seule droite. Mais chaque couple de points définit sa propre droite, et on 
n’a aucune raison de préférer une droite à une autre. 

Si les données expérimentales méritent une certaine confiance, l’incom- 
patibilité du système sert de raison pour rejeter l’hypothèse de la dépen- 
dance linéaire. Le problème de compatibilité des données expérimentales 
avec l’hypothèse de dépendance linéaire est résolu par l’analyse statistique. 

Supposons que la précision de l’information initiale admet l’existence 
de la dépendance linéaire. Dans ce cas, la chose qu’on doit faire en réalité, 
c’est obtenir une droite du plan de coordonnées qui soit le plus près de tous 
les points expérimentaux, sans passer peut-être par aucun couple de ces 
points, ni même par aucun de ces points (fig. 55). 

Pour pouvoir dire si un point est proche de la droite on utilise en géné- 
ral dans ce problème non pas la distance du point à la droite mais la diffé- 
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Fig. 55. 


rence des ordonnées y, — &x; — b et l’on choisit une droite de manière que 
la somme des carrés de toutes ces différences soit minimale. Les coeffi- 
cients #, et b, de l’équation de cette droite définissent la solution du pro- 
blème posé, qui n’est en aucune sorte la solution du système d’équations 
linéaires (ne présentant en général aucune solution). On peut prendre K,, et 
b, pour solution généralisée du système ou, comme on dit, sa pseudo- 
solution. La définition exacte de cette notion sera donnée plus loin. 

On se limitera au $ 1 aux propriétés élémentaires des pseudo-solutions 
et des matrices pseudo-inverses associées, qu’on peut déduire facilement 
sans recourir à autre chose qu'aux théorèmes sur les systèmes d’équations 
linéaires et les supplémentaires orthogonaux des sous-espaces euclidiens, 
connus du cours général. Ce paragraphe peut ainsi être assimilé par le lec- 
teur indépendamment des chapitres précédents. 

On envisagera le système d’équations linéaires 


Ax =D (1) 


à matrice À de type (m, n). La lettre r désignera le rang de cette matrice. 
Aucune contrainte n’est imposée en général à m, n et r. Puisque x est une 
matrice-colonne à n éléments, et b une matrice-colonne à m éléments, il est 
naturel de se servir, pour l'interprétation géométrique, des espaces arith- 
métiques Æ, et Æ,,. Par norme de la matrice-colonne x d’éléments x, … 
…, x" on entendra sa norme euclidienne, c’est-à-dire le nombre 


Le = Vax = Vox} +. + (x. 


2. Minimisation de l’écart. On appelle écart engendré par la matrice- 
colonne x après sa substitution dans le système d’équations (1) la matrice- 
colonne 


u = b — Ax. 


La solution de système est la matrice-colonne qui donne un écart nul. 

Si le système (1) est inçompatible, il est naturel de rechercher une 
matrice-colonne x dont l’écart a une norme minimale. Si une telle matrice- 
colonne existe, elle peut être considérée comme solution généralisée du 
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système. Il va de soi que si le système est compatible, sa solution est égale- 
ment une solution généralisée. 

En rapport avec ce qui vient d’être dit notons le fait suivant. On a déjà 
étudié les écarts au ch. XIII et on a essayé à diminuer leur normes, mais la 
situation y était différente. Le système avait une solution et la matrice- 
colonne à faible écart était prise pour approximation de cette solution. 
Tandis qu'ici on ne sait pas si la solution existe et on s’intéresse à la 
matrice-colonne présentant un écart minimal. On étudie maintenant de 
façon théorique les solutions généralisées en supposant que les calculs peu- 
vent être effectués exactement. Or dans la pratique, la solution généralisée, 
comme d’ailleurs tout autre objet, ne peut être calculée que de façon 
approchée. 

Pour comparer les écarts, profitons de la norme euclidienne et recher- 
chons donc la matrice-colonne x pour laquelle est minimale la grandeur 


ul? = '(b — Ax)(b — Ax). (2) 


En considérant les éléments de la matrice-colonne x comme des variables 
indépendantes, calculons la différentielle totale de fluh?. Il n’est pas diffi- 
cile de vérifier que 


diul? = —-d'x'A(b — Ax) — '(b — Ax) A dx. 


Vu que le second terme est une matrice d’ordre un qui ne varie pas par 
transposition, 1l vient 


dllul? = —2d'x 'A(b — Ax). 
Aussi la différentielle s’annule-t-elle si et seulement si 
l'A Ax = ‘Ab. (3) 


Ce système d'équations linéaires associé au système (1) est dit normal. Il 
résulte du système (1). Indépendamment de la compatibilité du système (1), 
on peut énoncer la 


PROPOSITION 1. Le système d'équations normal est obligatoirement com- 
patible. 

Cette proposition est un nouvel énoncé de la proposition 12 du $ 1, 
ch. XI. Toutefois, la démonstration directe en termes de matrices n’est pas 
compliquée et on va la fournir. La matrice 4 A est symétrique, de sorte que 
le système homogène transposé du système (3) est de la forme ‘44y = 0. 
Pour toute solution de ce système, on a les égalités découlant successive- 
ment l’une de l’autre : 

y ‘AAy = ‘"(Ay)(4y) = 0, A4y = 0, ‘y(°4b) = 0. 


La dernière d’entre elles signifie que le système (3) vérifie l’hypothèse du 
théorème de Fredholm, ce qui achève la démonstration. 
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ProPosiTion2. La borne inférieure du carré de la norme de l'écart est 
atteinte pour les seules solutions du système normal (3). 


DÉMONSTRATION. Ecrivons la formule (2) pour la matrice-colonne x, + 
+ Ax et ouvrons les parenthèses. Il vient 


1(b — A(xo + Ax)(b — A(xo + Ax)) = 
= ‘(b — AxçX(b — Ax,) — 2'(Ax)'A(b — Ax,) + (ax) AAA. 


Le dernier terme est positif car ‘(Ax)'4AAx = ‘(AAr)AAx) > 0. Si 
x, Vérifie le système (3), le second terme est nul et alors l’addition de Ax 
ne diminue pas la valeur de la fonction, quelle que soit cette matrice- 
colonne Ax. 

Inversement, la fonction définie pour tous les x n’atteint sa borne infé- 
rieure qu’en un point d’extrémum local. Or en ces points la différentielle 
est nulle, si bien que la condition (3) est satisfaite. La proposition est 
démontrée. 

Selon le théorème connu (théorème 2, $ 5, ch. V), l’ensemble de toutes 
les solutions du système normal peut être décrit par la formulex = x, +2, 
où x, est une solution fixée du système normal et z une solution quelconque 
du système homogène ‘447 = 0. On a vu en démontrant la proposition 1 
que ce dernier système est équivalent à 4z = 0, de sorte qu’on peut poser 
que la solution du système normal (3) est définie à une solution quelconque 
près du système homogène 4z = 0. On aboutit ainsi à la 


PROPOSITION. Le système normal possède une solution unique si et seu- 
lement si le système Az = 0 n'a qu'une solution triviale, c'est-à-dire si les 
colonnes de la matrice À sont linéairement indépendantes. En particulier, 
ce sera rempli si la matrice À est régulière. 


Si la solution du système normal n’est pas unique, il devient nécessaire 
de choisir l’une des solutions et l’on choisit la solution dont la norme est 
minimale. 


DÉFINITION. On appelle pseudo-solution normale d’un système d’équa- 
tions linéaires la matrice-colonne de norme minimale parmi toutes les 
matrices-colonnes qui, une fois portées dans ce système, donnent un écart 
minimal en norme. 

Puisqu'il n’y a pas de risque d’ambiguïté, on appellera parfois la 
pseudo-solution normale tout simplement pseudo-solution. 

Démontrons l’existence et l’unicité de la pseudo-solution normale. 
Pour le faire, il est commode d’utiliser les résultats de la théorie des espaces 
euclidiens. Considérons les espaces de matrices-colonnes #, et #,, munis 
du produit scalaire défini par la formule (x,y) = ‘xy. 

Soit. # © #, l’ensemble des solutions du système homogène Az = Det 
soit. © ®#, l’ensemble des matrices-colonnes de la forme ‘4b pour tous 
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les b e À,, possibles. La conditionp e .S est équivalente à la compatibilité 
du système d’équations linéaires ‘4x = p. D’autre part, selon le théorème 
de Fredholm, le dernier système est compatible si et seulement si pour cha- 
quez e Ÿ est vérifiée l’égalité ‘2 = 0. Cela signifie que 


HN = S+. 


Rappelons que, quel que soit le sous-espace = dans l’espace euclidien, 
tout vecteur x peut être décomposé de façon unique en somme de la forme 
x’ +x”,oùx'ef etx' eZ “. Les vecteursx' etx'” sont appelés pro- 
jections orthogonales de x sur À et À + respectivement. 

Notons .# l’ensemble des solutions du système normal d'équations 
linéaires (3). On a vu que les matrices-colonnes de .# sont définies par la 
formule x = x, + z, où x, est une matrice-colonne de .# et z e .#-. 


LA 


THÉORÈME 1. Tout système d'équations linéaires possède une pseudo- 
solution normale et une seule. 


En vertu de la proposition 2, il suffit de démontrer que dans l’ensemble 
SN il existe toujours une matrice-colonne de norme minimale et une seule. 
Pour le démontrer, décomposons une matrice-colonne quelconque x de # 
en somme de ses projections orthogonales x, et x, sur .f et sur #. 

Il est évident que x, appartient aussi à .# parce que diffère de x par la 
matrice-colonne x, € .#. 

Si y est une autre matrice-colonne de .#, sa projection orthogonale sur 
JS vaut également x,. En effet, y = (y — x + x,) + x,, avec (y — x) + 
+ x, e Ÿ, et il reste à se référer à l’unicité des projections orthogonales. 
Ainsi donc, pour tous les vecteurs de .# le terme x, est le même. 

Pour un x quelconque de .# on peut écrire 


Lei? = (x, + xo)(x, + x0) = Lx? + x l?, 


vu que %x,x, = 0. Il en découle que Exi > Ix,l, l'égalité étant réalisée si 

x, = 0, c’est-à-dire six = x,. Cela montre qu’il y a dans .# une seule 

matrice-colonne dont la norme est minimale. Le théorème est démontré. 
Il découle de la démonstration du théorème que la pseudo-solution nor- 

male peut être caractérisée par l’une quelconque des propriétés suivantes : 
a) Elle est l’unique vecteur commun que possèdent . et .# : 


c’est-à-dire qu’elle est l’unique solution du système normal, de forme 
Xo = ‘AZ. (5) 


b) Elle est la projection orthogonale de toute solution du système nor- 
mal sur l’ensemble .f des matrices-colonnes de la forme ‘Az. 
PROPOSITION 4. Soient x, et x. les pseudo-solutions normales de deux 
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systèmes d'équations linéaires Ax = b et Ax = c. Alors fx, + x, est la 
pseudo-solution normale du système Ax = Bb + y. 

DÉMONSTRATION. Il découle de ‘4Ax, = ‘4b et de 'AAx, = ‘Ac que 
Bx, + 7x, vérifie le système normal : ‘AA (Gx, + 7x.) = ‘A(Bb + yc). 
Ensuite, il existe des matrices-colonnes z, et z, telles quex, = ‘Az, etx, = 
= ‘Az. Donc, Bx, + x, = "A(Bz, + yz.), ce qui achève la démonstra- 
tion. 

Il va de soi que la proposition 4 peut être étendue à toutes les combinai- 
sons linéaires de matrices-colonnes. 

Etudions quelques exemples fort simples. 

1) Système de deux équations à une inconnue : 

x = 1, x = 2. 


Le système normal associé à ce système est 


| | 
nu-flrenu.f| 
| 2 


ou 2x = 3. Il s’ensuit que la pseudo-solution vaut 3/2. 
2) Système d’une équation à deux inconnues : 


xl Ex = 2. 


Le système d’équations normal est le système 


RÉMRRENE 
1 x? l 


comprenant la même équation répétée deux fois. Sa solution générale est 


=] 
x2h  |o ” EE 


La pseudo-solution sera la solution obtenue par multiplication de ‘4 = 


] e ? ? e e (4 
= par une matrice-colonne z à m = 1 éléments. On voit aisément que 


El - 
x? LR 

3) Système d’une équation à une inconnue ax = B. Siæ # 0, la pseudo- 
solution coïncide avec la solution x = B/œ. Mais si = 0, tout nombre x 
donne par substitution le même écart 8 de norme 181. De tous les nombres 


il faut choisir celui dont la norme est minimale, c’est-à-dire 0. Ainsi donc, 
la pseudo-solution de l’équation Ox = B est O. 


cette solution est 
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On aurait obtenu le même résultat, s’il on avait complété la définition 
de la fonction f(æ) = 1/œ par f(0) = 0. On voit que dans ce cas la pseudo- 
solution n’est pas une fonction continue par rapport aux éléments de la 
matrice du système et de la matrice-colonne des termes constants. Le même 
défaut est observé dans le cas général du système de m équations et nr incon- 
nues. 

4) Système d’équations linéaires à matrice nulle Ox = b. La pseudo- 
solution est obtenue de la même façon que dans l’exemple 3 : tous les vec- 
teurs engendrent le même écart égal à b, dont le vecteur nul qui a la norme 
minimale et qui est de ce fait la pseudo-solution du système. 

3. Matrice pseudo-inverse. Pour une matrice carrée régulière À d’ordre 
n on peut définir la matrice inverse comme une matrice dont les colonnes 
sont solutions du système d’équations linéaires de la forme 


AX =e; (6) 


oùe; est la i-ième colonne de la matrice unité d’ordre n. Par anologie, on 
peut donner la 


DÉFINITION. On appelle matrice pseudo-inverse de la matrice À de type 
(m,n)la matrice À * dont les colonnes sont les pseudo-solutions des systè- 
mes d’équations linéaires de la forme (6), où e; sont les colonnes de la 
matrice unité d’ordre m. 

Ceci étant, À * est composée de m colonnes à nr éléments, c’est-à-dire est 
de même type (7, m) que la matrice ‘A. 

Il découle du théorème 1 que toute matrice admet une seule matrice 
pseudo-inverse. 

Pour une matrice carrée régulière À, la pseudo-solution de chacun des 
systèmes (6) se confond avec la solution et par suite, la matrice pseudo- 
inverse coïncide avec la matrice inverse. 

Dans un autre cas particulier, celui de la matrice nulle à m lignes et n 
colonnes, on peut conclure en appliquant le résultat obtenu dans l’exemple 
4 ci-dessus que la matrice pseudo-inverse est la matrice nulle à n lignes et m 
colonnes. 


PROPOSITIONS. La pseudo-solution du système d'équations linéaires (1) 
peut être écrite sous la forme x, = A*b. 


En effet, la matrice-colonne des termes constants b est une combinaison 
linéaire des colonnes de la matrice unité d’ordre m : 


b=6e, +... +6,,e,. 


D’après la définition de la matrice pseudo-inverse et selon la proposition 4, 
la pseudo-solution x, est une combinaison linéaire des colonnes de la 
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matrice pseudo-inverse, dont les coefficients sont les mêmes : 
Xo=B,a +.…+86,a; 


mm: 


Ce qui est équivalent à l’assertion qu’il fallait démontrer. 

Notons que la proposition 5 est en général d’une importance théorique, 
de même que la règle de Cramer pour les matrices régulières. La recherche 
de la matrice pseudo-inverse n’est pas obligatoire pour le calcul de la 
pseudo-solution normale et exige de grands efforts. 

Rappelons que la norme euclidienne AI. de la matrice À est la racine 
carrée de la somme des carrés de ses éléments (comp. $ 4, ch. XI). La 
matrice pseudo-inverse possède la propriété d’extrémum suivante. 


PROPOSITION6. Pour toute matrice X à n lignes et m colonnes on a la 


relation 


De plus, si pour une matrice quelconque X différente de À * se réalise l'éga- 
lité, on a A*N, < IX. 


DÉMONSTRATION. De par la définition, pour tout i la colonne a * de la 
matrice pseudo-inverse donne par substitution dans le système (6) un écart 
minimal. Aussi pour la i-ième colonne de la matrice X a-t-on 


Si on aboutit à une égalité pour x; + a;*, on a lla;*  < Ix:ll. Notons que le 
carré de la norme euclidienne de la matrice est égal à la somme des carrés 
des normes de ses colonnes. Donc, en élevant au carré et en sommant les 
relations données pour tous les à = 1, ., m, on aboutit à la proposition 
nécessaire. : 

D’après la formule (5), il existe pour tout i = 1, ..., m une matrice- 
colonne z; telle que la i-ième colonne de la matrice pseudo-inverse prend la 
formea;* = ‘Az. Donc, il existe une matrice carrée Z d’ordre m telle que 


A* = 'AZ. (7) 


Cette matrice est la matrice Z = z,, ..…., z,,| composée des matrices- 
colonnes z.. 

La pseudo-solution À * b du système Ax = b vérifie le système normal 
associé et, par suite, 


(AAA * b = 'Ab. 
Cette égalité a lieu pour toute matrice-colonne des termes constants b, si 


bien que les matrices dans le premier et dans le second membre de l’égalité 
sont égales. Donc 


'AAA* = 'A. (8) 
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Parfois il est utile de formuler ce résultat d’une façon analogue à (7) : il 
existe une matrice carrée Z, d’ordre n pour laquelle 


Z,A* = "A. 
PROPOSITION 7. La matrice X est une matrice pseudo-inverse de À si et 
seulement si 
l4AAX = ‘A 


et il existe une matrice carrée Z telle que X = ‘AZ. 


La nécessité de ces conditions découle des formules (7) et (8). Démon- 
trons la suffisance. A cet effet, remarquons que pour la i-ième colonne de 
la matrice unité il ressort de 'AAX = !À que 


'AAXe, = ‘Ae,, 


î 


ce qui signifie que Xe;, c’est-à-dire la i-ième colonne de X, vérifie le 
système normal associé au i-ième système (6). De plus, cette matrice- 
colonne satisfait à la condition (5), avec la i-ième colonne de la matrice Z : 


La proposition est démontrée. 
En se servant de la proposition 7, on établit facilement que pour tout 
nombre « différent de zéro 


(xA)* = ax"! At. 
De la proposition 7 découle aussi la 
PROPOSITIONS. Si U est une matrice orthogonale d’ordre m, on a 
(UA)* = (Aa*}('U), 
et pour une matrice orthogonale d'ordre n, 
(AU)* = 'UA*. 
Démontrons la première égalité. Pour la matrice À on a selon (7) 
(A*)'U =: 'AZ'U. D'où (4*)'U = 'A'UUZ'U = (UAUZ'U). Cela 


signifie que la matrice (4 * )'U est le produit de '(UA ) par la matrice carrée 
Z, = UZ'U. Ensuite, en vertu de l’égalité (8), on a pour la matrice À 


A UUA (A* )'U = 'A'U. 


Ainsi, on a démontré la première partie de la proposition. La seconde par- 
tie se démontre de façon analogue. 

Remarquons que l’hypothèse sur l’orthogonalité de la matrice U est ici 
essentielle. Déjà pour la matrice carrée régulière S, on a 


(SA)* # AS”, 
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comme le montre l’exemple suivant. Soient 


0 4- fo] dl 
= : = t — = : 
> # ÉiTEe MEL 


La matrice ‘BB possède le seul élément 5, de sorte que la formule (8) donne 


B* = : ; £ |: D'autre part, on voit aussitôt que 
o À 
| 2 
sil À éme « 48-12 fo] 
Le: | è 
2 4 


Ainsi, la formule connue d’inversion du produit de matrices ne peut 
être généralisée pour les matrices pseudo-inverses : 


(AB)* + B*A*. 


Le lecteur désireux de connaître les conditions nécessaires et suffisantes 
pour que l’égalité (4B)* = B*A* soit réalisée, ainsi que l'expression 
dans le cas général de la matrice pseudo-inverse du produit, peut les trouver 
dans le livre d’Albert [1]. 

La proposition suivante permet de trouver la matrice pseudo-inverse 
dans deux cas particuliers importants. 


PROPOSITION 9. Si les colonnes de la matrice À sont linéairement indé- 
pendantes, 


A* = (44) 7!('A). (9) 
Si les lignes de la matrice À sont linéairement indépendantes, 
At ='A(A'A) 1. (10) 


Démontrons la première assertion. Si les colonnes de À sont linéaire- 
ment indépendantes, le système normal ‘4AAx = ‘Ab présente d’après la 
proposition 3 une solution unique pour toute matrice-colonne b. La 
matrice 44 possède dans ce cas une inverse, et la solution est donc égale à 
((4AA)"!('A)b. En remplaçant b par les colonnes de la matrice unité 
d’ordre m, on constate que les colonnes de A * sont les colonnes de la 
matrice du second membre de (9). 

Si les lignes de la matrice À sont linéairement indépendantes, le système 
Ax = best compatible pour tout b selon le théorème de Kronecker-Capelli 
et, par suite, la solution dont la norme est minimale est sa pseudo-solution 
normale. Cette solution est de la formex = ‘Az avec un certain z. Il nous 
faut donc rechercher la matrice-colonne z qui vérifie le système d'équations 
linéaires 4 {Az = b. 
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Dans le cas considéré, la matrice À ‘4 possède une inverse et, par suite, z 
= (4‘4)- D, de sorte que la pseudo-solution normale du système Ax = 
= b est la matrice-colonne x = ‘4(4‘4)-'b. D'où, en remplaçant b par 
les colonnes de la matrice unité, on arrive à la formule (10). 

Le calcul de la matrice pseudo-inverse de toute matrice non nulle À peut 
être ramené à deux cas décrits dans la proposition 9 si on décompose À en 
produit de facteurs appelé décomposition squelettique. 

On appelle décomposition squelettique d’une matrice À de type (m,n) 
et de rang r > 0 la décomposition de la forme 4 = BC, où B et C sont des 
matrices de type (m,r) et (7, n) respectivement. 

Vu que le rang du produit ne dépasse pas ceux des facteurs et que les 
rangs de B et C ne peuvent être supérieurs à r, ils sont égaux à r. 

On peut obtenir la décomposition squelettique d’une matrice non nulle 
par exemple de la façon suivante. Considérons les colonnes de la matrice 4 
qui renferment son mineur principal et composons à partir d’elles la 
matrice B. C’est une matrice à m lignes et r colonnes. D’après un théorème 
connu, chaque colonne de la matrice À est une combinaison linéaire des 
colonnes de la matrice B. Ecrivons les coefficients de ces combinaisons 
linéaires en colonnes et disposons-les dans l’ordre naturel, en obtenant par 
là même la matrice C. Cette matrice possède r colonnes à r éléments, c’est- 
à-dire qu’elle est de type (r, ñn). 

On sait que la £-ième colonne du produit des matrices est une combinai- 
son linéaire des colonnes du premier facteur dont les coefficients sont 
égaux aux éléments de la £-ième colonne du second facteur. Donc, 4 = BC 
et on a obtenu l’une des décompositions squelettiques de la matrice À. 

Sous l’angle de calcul numérique, ce procédé d’obtention de la décom- 
position squelettique est loin d’être parfait. On étudiera d’autres procédés 
dans le $ 3. 

On a vu que dans le cas général la formule (BC) = C'B* est fausse. 
Toutefois, on a la proposition suivante. 


PROPOSITIONI0. Si À = BC est une décomposition squelettique de la 
matrice À, sa matrice pseudo-inverse est 


At = C*B* = 'C(C'C)-'('BB) !('B). 


DÉMONSTRATION. Vu que le rang de B et de C'est r, les lignes de Cet 
les colonnes de B sont linéairement indépendantes. En vertu de la proposi- 
tion 9,C* = 'C(C'C)-'etB* = (BB) !('B). Vérifions pour la matrice 
R = 'C(C'C)- (BB) !('B) la condition (8). En portant ‘44 = !C ‘BBC, 
on a 

IC'BBC'C(C'C) (BB)! ('B) = ‘C'B, 


ce qu’il fallait démontrer. 
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La condition (7) imposée à la matrice R signifie qu'il existe une matrice 
carrée Z pour laquelle R = ‘C'BZ. La condition sera vérifiée si l’on démon- 
tre l’existence d’une matrice carrée Z d’ordre m pour laquelle ‘BZ = 
= (CC) '(BB)" !('B). La dernière égalité est équivalente aux systèmes 
d’équations linéaires de la forme 


Bz,=5, (i=1,..,m) 


pour les colonnes de la matrice Z, où le second membre du i-ième système 
est la i-ième colonne de la matrice S = (C'C)-!(‘BB)-!('B). (Il est aisé de 
vérifier que la matrice S est de type (7, m).) Les lignes de la matrice 'B, 
autrement dit les colonnes de la matrice B, sont linéairement indépendan- 
tes, et par suite, chacun des systèmes est compatible en vertu du théorème 
de Kronecker-Capelli. 

Ainsi, les deux conditions (7) et (8) sont vraies pour la matrice R, si bien 
que la proposition 10 découle de la proposition 7. 

La proposition 10 permet d’obtenir certaines propriétés des matrices 
pseudo-inverses. A savoir, on a l'égalité 


(4°) = CA)*. (11) 


En effet, les matrices ‘BB et C ‘C sont symétriques. Il en est de même de 
leurs inverses. Aussi, en transposant l’expression de À *, aboutit-on à 


((A*) = B('BB)7!'(C'C)-!'C. 


Or ‘A = 'C !B est une décomposition squelettique de ‘A4. En l’appliquant, 
on obtient exactement la même expression pour (‘4 )*. La démonstration 
donnée ne convient pas à la matrice nulle, mais pour cette matrice la for- 
mule (11) est évidente. On achève ainsi la démonstration de la formule (11). 
Ensuite, en utilisant toujours la même proposition 10, on obtient 


AA ="'C(C'C)"C, (12) 


d’où on voit, en particulier, que la matrice À *A est symétrique. 

Admettons comme plus haut que .# désigne l’ensemble des solutions 
du système 4z = 0, et.” l’ensemble des matrices-colonnes de la forme ‘4b 
pour tous les b possibles. 


PROPOSITION 11. Pour toute matrice-colonne x, la matrice-colonne 
A ‘Ax est une projection orthogonale de x sur S. 


DÉMONSTRATION. Si la matrice À est nulle, l’ensemble . n’est composé 
que du zéro, et la proposition est évidente. Pour une matrice À non nulle, 
on peut recourir à la formule (12). Représentons une matrice-colonne x à 7 
éléments sous la formex, + x,,oùx,e.f etx,e.*#. Alors À *Ax, = O car 
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Ax, = 0, si bien qu’on aboutit, en vertu des formules (5) et (12), à 
À *Axo + x) = À * Ax, = À * A 'Az = (C(C'C)7!C'C'Bz = 'Az = xs. 
La proposition est démontrée. 


Appliquons la formule (12) à la matrice ‘4. On s’assure que la matrice 
(A)* (A) est symétrique et l’on obtient d’après la formule (11) que 


(4)* (4) = ((4)* (4)) = AA*. 
Maintenant, en appliquant la proposition 11 à la matrice ‘4, on obtient le 


COROLLAIRE. Pour toute matrice-colonne y € #,,, la matrice-colonne 
AA * y est une projection orthogonale de y sur le sous-espace des matrices- 
colonnes de la forme Az pour tous les z possibles de #,,. 


De la proposition 11 et de son corollaire on déduit que les matrices 
AA et AA * sont idempotentes, c’est-à-dire que 


(A *A})? = À *A, 

(AA * )? = AA*. 
Chaque colonne de la matrice À * est une pseudo-solution normale du 
système (6) à matrice À et par suite, se trouve dans .. En appliquant la 


proposition 11, on obtient 4 *4a* = a;* pour toute matrice-colonne de 
A* et, par suite, 


ATAA* = A*. (13) 
D'une façon analogue, en se servant du corollaire de la proposition 11, on 
peut démontrer la formule 
AA *A = À. (14) 
En utilisant la majoration du rang du produit de matrices dans les égali- 
tés (13) et (14), on obtient 
Rg A‘ = RgA‘AA* < R£gA 
et 
Rg À = Rg AAA* < Rg A*, 
d’où 
RgA = RgA*. (15) 
PROPOSITION 12. La matrice pseudo-inverse À * est la seule à vérifier les 
égalités 
AXA = À, ‘(AX) = AX 
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el 
XAX = X, #"'(XA) = XA. 


DÉMONSTRATION. On a vu plus haut que pour X = À * toutes ces égalités 
sont vérifiées. Démontrons qu’elles ne le sont que pour À *. 

Transposons la première égalité : 4'(4X) = ‘4. D’où en vertu de la 
deuxième égalité on a 4 AX = ‘A. Par ailleurs, en portant la quatrième 
égalité dans la troisième, on obtient 


X = XAX = '(XA)X = 'A'XX, 


ou *Ÿ = ‘AZ, avec Z = ‘XX. Maintenant la proposition 12 découle de la 
proposition 7. 

Utilisons les propriétés obtenues de la matrice pseudo-inverse à la 
recherche de la solution générale d’un système normal. 


PROPOSITION 13. La solution générale du système normal (3) associé au 
système (1) se définit par la formule 


x=A"b+(E - A‘A)c, 


où c est une matrice-colonne à n éléments. En particulier, si le système (1) 
est compatible, cette formule définit sa solution générale. 


DÉMONSTRATION. Selon la proposition 5, la matrice-colonne À *b est la 
pseudo-solution normale et par suite, est une solution particulière du 
système (3). Il reste à démontrer que la matrice-colonnez = (E — À *A)jc 
est pour un c arbitraire la solution générale du système homogène normal 
(4Az = 0. Démontrons-le. 

D'abord, pour tout c 


t(AAI(E — A*A)c] = ‘AAc =— ‘AAA * Ac = ‘AAc — 'AAc = 0. 


Cela signifie que z est la solution du système homogène normal. 
Ensuite, pour toute solution z du système ‘44z = 0 il existe une 
matrice-colonne c pour laquelle 


z=(E - A‘Ajc. 


On peut tout simplement poser c = z car le système ‘447 = 0 est équiva- 
lent au système 4z = 0 et, par suite, 


(E — A‘'A)z = — A'Az = 2, 


ce qui achève la démonstration de la proposition. 

On peut obtenir l’interprétation géométrique de ce résultat en remar- 
quant qu’en vertu de la proposition 11 la matrice-colonne (E — À * À jc est 
pour tout c une projection orthogonale de c sur le sous-espace .# des solu- 
tions du système Az = 0. 
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$ 2. Application pseudo-inverse 


Dans ce paragraphe, à la différence du $ 1, on suivra le point de vue 
géométrique. On y définira et étudiera une application pseudo-inverse de 
l’application linéaire À : 4, — €, où €, et é”,, sont des espaces euclidiens 
de dimension ñn et m. 

1. Définition. L'application À peut s’avérer non bijective pour deux 
raisons : ou bien Ker À + o et l’on obtient alors deux vecteurs différents x, 
et x, dans €, dont les images coïncident ; ou bien Im À ne coïncide pas avec 
Em €t il existe alors dans <”,, un vecteur qui n’a pas d’antécédent. Rappe- 
lons que pour une application adjointe A* : &,, — €’, est vérifiée l’égalité 
Im A* = (Ker A)‘. Aussi À est-elle une bijection si et seulement si sont 
réalisées deux conditions : 


Im A* = “ 


n? 


Im À = &,. 
On peut transformer À en une application bijective si l’on se limite aux 


sous-espaces des espaces donnés. Plus précisément on a la proposition sui- 
vante. 


PROPOSITION 1. Soit À, la restriction de À à Im A*. Alors À, applique 
Im A* sur Im À de façon bijective. 


En effet, considérons un vecteur arbitraire y e Im A. Il a un antécédent 
x dans 6. Décomposons x en somme x, + x,,où x,e Im A*etx,e Ker A. 
Alors A(x) = A(x,) + A(x,) = A(x,). Donc, l’antécédent de y est le vec- 
teur x, de Im A*. 

Montrons que cet antécédent est unique dans Im A*. En effet, soient 
Xor Xo € Im A* et A(x,) = A(x;). Cela signifie que x, — x} elmA* et 
Xo — XQ € Ker À, d’où x, — x, = 0. 

L'application À, introduite dans la proposition 1, comme toute applica- 
tion bijective, possède une application inverse Ac! définie sur le sous- 
espace Im À Ç Ge: On veut définir une aHplication linéaire À * Ê C7 
pour laquelle A; est une restriction à Im À. A cet effet, introduisons une 
application P qui associe à chaque vecteur y e <”,, la projection orthogo- 
nale de y sur Im A. 


Dérinirion. L'application As !P : ©, — € est dite pseudo-inverse de A 
et est notée À *. 

PROPOSITION 2. Quelles que soient les bases orthonormées e dans &, et f 
dans €&,, la matrice de l'application À * par rapport aux bases f et e est 
pseudo-inverse de la matrice de l'application À par rapport aux bases e et f. 


DÉMONSTRATION. Vérifions d’abord que les applications À, A* et A* 


sont liées par la relation 
A* AA*‘ = A*. 
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Considérons pour cela un vecteur y € E. et-notons y’ sa projection 
orthogonale sur Im A. L'image de y par l’application A*AA* est 
A*AAS PO) = A'AAS 0°) = A*O'). 

D'autre part, y — y” e (Im A): = Ker A*, et par suite, A*(y) = 
= A*(y°). L'égalité est donc vérifiée. Si les bases sont orthonormées et 
l'application À a pour matrice À, ‘A est alors la matrice de l’application 
A’. Donc, la matrice de l’application À * satisfait à la condition (8) du $ 1. 

Etablissons l’égalité (7) du $ 1. D’après la définition de l’application 
A*onaïlmA* € Im A*. Aussi pour chacun des vecteurs de base f; (i = 
= 1,...,m) existe-t-il un vecteur z; tel que À * (/;) = A*(z,). Cela signifie 
en coordonnées que la i-ième colonne de la matrice associée à l’application 
A* est de la forme ‘Af;, pour une matrice-colonne f'; appropriée. Ceci est 
équivalent à l’égalité qu’il fallait vérifier. 

On s’est assuré que dans un couple de bases orthonormées la matrice de 
l’application pseudo-inverse vérifie les égalités (8) et (7) du $ 1. Pour ache- 
ver la démonstration, il ne reste qu’à se référer à la proposition 7 du $ 1. 

Remarquons que l'inclusion Im À * © Im A* écrite lors de la démons- 
tration de la proposition 2 donne avec l’égalité des rangs (15) du $ 1 


ImA* =ImA*. (1) 


La proposition 2 permet de rapporter les résultats sur les matrices 
pseudo-inverses obtenus au $ 1 aux applications pseudo-inverses. Notons, 
par exemple, que 


(A*)* = (A*)*. (2) 


Mais on ne s’arrêtera pas systématiquement sur ce fait. Notre objectif 
immédiat est de simplifier la matrice de l’application À * par un choix con- 
venable de bases. 

2. Application pseudo-inverse en bases singulières. Il existe pour 
l’application À des bases singulières e dans ,, et f dans <",,, telles que la 
matrice de l’application À par rapport à ces bases se met sous la forme indi- 
quée au théorème 1 du $ 1, ch. XI : 


., O 
D = * a, à (3) 
O O 
Les seuls éléments non nuls de cette matrice sont de la forme d;; = a; pour 


ir = Re A. 

Les matrices de cette forme généralisent les matrices diagonales carrées. 
La matrice rectangulaire d'éléments d,, = 0 pour i # j sera appelée matrice 
diagonale. 
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Les éléments non nuls de la matrice (3) seront appelés nombres singu- 
liers non nuls de l’application A. 

Vu que les bases singulières sont orthonormées, l’application pseudo- 
inverse À * de l’application À se définit dans les bases singulières par la 
matrice D*. 

Cherchons la matrice pseudo-inverse de la matrice diagonale. Sa i-ième 
colonne est pour tout i = 1, ..., m la pseudo-solution normale du système 
d'équations linéaires DE = &;, où &; est la i-ième colonne de la matrice 
unité d’ordre m. Le système d’équations normal associé à ce système, soit : 

‘DDE = 'De;, 


peut être écrit d’une façon plus détaillée : 
a£/=a"0 pour j#i j<r, 
a?£i= a; pour i<rpr, 
O-£* = 0 pour kK>r. 


Il va de soi que la matrice-colonne £ sera solution de ce système si £' = ar! 
pour i <r,et£/ = 0 pour j # i, j < r, quels que soient les éléments £* 
pour # > r. La solution possédera la norme minimale si tous ces éléments 
sont nuls, c’est-à-dire si £* = 0 pour & > r. Ainsi donc, la i-ième colonne 
de la matrice D* est égale à ‘10 … &7!0 … OÙ pour i < ret à 0 pour i > r. 
La matrice D * composée de ces colonnes est diagonale de type (7, m), avec 
les nombres a; !, …, œ; ! sur la « diagonale » : 


ay O 
D* = ‘ar! | (4) 

O O 
Enumérons quelques conséquences immédiates du résultat obtenu. Vu 
que D* est une matrice diagonale, sa matrice pseudo-inverse se construit 


suivant la même règle et l’on constate que (D*)* = D. Il s’ensuit que pour 


une application arbitraire 
(A*)* = A. (5) 


En écrivant la relation analogue entre les matrices rapportées à un couple 
de bases orthonormées, on obtient la propriété suivante de l’opération de 
passage à la matrice pseudo-inverse : 


(A*)* = A. (6) 


La comparaison des matrices D * et ‘D montre que l’égalité A* = A* 
est vérifiée si et seulement si les nombres singuliers non nuls de À sont 
égaux à 1. Cette propriété généralise la propriété de la transformation 
orthogonale pour laquelle A-! = A* et tous les nombres singuliers sont 
égaux à 1. 
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Désignons par e et f respectivement la première et la seconde base singu- 
lière de l’application À. Soit D la matrice de À par rapport aux bases e et f. 
D* est alors la matrice de À * par rapport aux bases f ete, et '(D*)D* la 
matrice de l’application (A * }*A * dans la base f. 

On voit aussitôt que 


‘((D*)D* = diag (æœ;°,.…, ar °?,0, …, 0) 


est une matrice diagonale carrée d’ordre m. Cela signifie que la seconde 
base singulière f de l’application À est composée des vecteurs propres de 
l'application ‘(A * }A*. Elle ne peut donc différer de la première base sin- 
gulière de l’application À * que par l’ordre des vecteurs. (Rappelons que les 
vecteurs de la base singulière sont ordonnés de manière que la suite des 
nombres singuliers soit décroissante.) 

Par ailleurs, les images des vecteurs de la base f par l’application A * 
sont des vecteurs dont les colonnes de coordonnées s’identifient aux colon- 
nes de la matrice D *. On les obtient en multipliant certains vecteurs de la 
base e par les facteurs &; ! ou 0. La base e est une base orthonormée dans 
6, qui contient des vecteurs normés non nuls À * (f;). Aussi la base e ne 
diffère-t-elle de la seconde base singulière de l’application À * que par 
l’ordre des vecteurs. On obtient donc la 


PROPOSITION 3. La première et la seconde base singulière de l'application 
A* ne diffèrent respectivement de la seconde et de la première base singu- 
lière de l’application À que par l'ordre des vecteurs. Si æ«,, …, æ«, sont des 
nombres singuliers non nuls de À, alors a7}, .…, œ;! sont ceux de A*. 


Fr D 
Pour toute application, le noyau est l’enveloppe linéaire des vecteurs de 
la première base singulière qui correspondent aux nombres singuliers nuls. 


Aussi bien pour À * que pour A", ce sont les vecteurs f,,,, .…,/f,. Donc, 
Ker A‘ = Ker A*. (7) 
Le passage aux bases singulières permet de vérifier facilement diverses 


identités se rapportant aux matrices pseudo-inverses. Démontrons par 
exemple les égalités qui généralisent les formules (9) et (10) du $ 1 : 


A* =(A44)"(A) (8) 
et 
At = 'A(A4A)*. (9) 


Il ressort de la proposition 2 que l’égalité (8) est équivalente à la décom- 
position suivante de l’application pseudo-inverse : 


A* = (A*A)* A*. 


Cette égalité est invariante et, par suite, il suffit de la vérifier pour un cou- 
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ple quelconque de bases. Vérifions-la pour les bases singulières de l’appli- 
cation À. 

Dans ce cas, la matrice D de l’application À est de la forme (3). En 
appliquant la formule (4) à la matrice diagonale ‘DD, on obtient 


('DD)* = diag (ar ?, …, @7 7, 0, …, 0). 


r D 


On voit aussitôt que le produit (‘DD )* ('D) se confond avec D*. Ce qu’il 
fallait justement. La formule (9) se démontre de façon analogue. 

3. Pseudo-inversion par passage à la limite. Désignons par # V’ensem- 
ble de toutes les applications linéaires de &”, dans &,. Les opérations 
d’addition et de multiplication par un nombre dans # ont été introduites 
dans le chapitre XI. On voit aisément que l’ensemble # muni de ces opéra- 
tions est un espace vectoriel et que le choix de bases dans €”, et €, établit 
un isomorphisme de # sur l’espace .#, ,, des matrices à n lignes et m 
colonnes. 

Supposons qu’à chaque nombre À de l'intervalle ]Jæ, B[ est associée une 
application B() e 7. On dira dans ce cas que sur Ja, B[ est définie une 
fonction à valeurs dans # 

Pour définir la notion de limite pour une fonction à valeurs dans #, 
introduisons dans #” une norme. On peut le faire par exemple ainsi. Rap- 
portons les espaces &”,, et €, à deux bases orthonormées et considérons la 
matrice B de l’application B eZ Sa norme spectrale ne varie pas lorsqu’on 
multiplie B à gauche et à droite par des matrices orthogonales, c’est-à-dire 
que BI = IUBVA pour des matrices orthogonales quelconques U et V 
d’ordre ñn et m respectivement. Aussi la norme spectrale de la matrice de 
l'application B est-elle indépendante du choix de bases orthonormées et 
peut être prise pour norme de l’application B. On la notera KB en donnant 
la définition suivante. 

L'application B est appelée limite de la fonction B(X) pour À — y si 
pour tout € > Oil existe un nombre à tel que O0 < IX — ul < € entraîne 
IB(A) — BE < €. 

On voit aussitôt que pour tout couple de bases orthonormées la relation 


lim B(X\) = B 
À—y 
entraîne une relation analogue pour les matrices des applications considé- 


reées : 
lim B(X\) = B. 
À—u 


Revenons maintenant à l’étude de l’application À : €, — &,, et de sa 


pseudo-inverse et considérons une transformation de l’espace <,, définie 
par l’expression AA* + œE, où Eest la transformation indentique de &,,.. 
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Démontrons que pour æ > 0 cette transformation possède une inverse. 
Pour ne pas oublier le fait que & est strictement positif, désignons « par À? 
et montrons que la matrice de la transformation AA* + \’E est régulière 
dans toute base orthonormée, et qu’elle est de plus définie positive. En 
effet, pour toute matrice-colonne £ non nulle, il vient 


ECA'A + AE)E = 'CAECAE) + ACE)E > 0. 


Ainsi, pour tout nombre À # Oest définie une application B (À) : A — 
— 6, suivant la formule 


B(A) = A*(AA* + À’ E)-!. 
D'une façon analogue, on peut définir une application 
(A*A + \°E)-'A* 


et démontrer l’existence de la transformation inverse de A*A+ A? E dans 
l’espace €, comme on vient de le faire pour AA* + À\°E. 


PROPOSITION 4. On a les relations 
lim A*(AA* + N2E)-! = A+ 


et 
lim (A'A + \°E)-!A* = A*. 


Les deux formules se démontrent de façon identique. Démontrons donc 
la première. Pour cela, écrivons la matrice de l’application, qui se trouve 
sous le signe limite, par rapport aux bases singulières de l’application À. Si 
la matrice À rapportée à ces bases est notée D, la matrice cherchée est 
(D(DD + X?E)"!. En tenant compte de la forme (3) de la matrice D, on 
remarque que C: = (D'D + N\?E) ! est une matrice diagonale à éléments 
diagonaux 


(a? + À2)7!,.., (@2 + A?)7!, T2, A TË 


La matrice DC est matrice diagonale de même type (n7, m) que D et 
présente sur la diagonale r éléments non nuls 


CT (a? + X2)7 1... a, (œ? + X2)7! 


(les éléments de la matrice C, égaux à À 72, ont été multipliés par 0). Quand 
À — 0, la matrice (DC tend au sens de convergence en éléments vers la 
matrice D* définie par la fourmule (4). Elle doit tendre aussi vers cette 
matrice en norme spectrale. D'où il découle immédiatement la relation 
nécessaire. 

La proposition 4 entraîne les expressions suivantes pour la matrice 
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pseudo-inverse : 


lim tA(A'A + X?E)7! = A*, (10) 
lim (AA + NE)" ! (A) = A*. (11) 
Considérons le système d’équations linéaires à matrice régulière 
(AA + A?E)E = 'Ab. (12) 
Désignons sa solution par &£,. Alors 
£, = (‘AA + \'E)7 (A )b (13) 


et la formule (11) montre qu’est vraie la 


PROPOSITION 5. La solution £, du Système (12) tend pour À — 0 vers la 
pseudo-solution normale du système AË = b. 


Cette proposition est d’une grande importance théorique. On sait que la 
pseudo-solution normale du système d'équations linéaires n’est pas une 
fonction continue de la matrice du système. La proposition 5 montre que le 
système donné peut être inclus dans une famille de systèmes de paramètre 
N, de manière que la solution du système dépend continüment de ce para- 
mèêtre. Ce résultat a été obtenu dans un contexte plus général de la théorie 
des fonctionnelles de régularisation pour les problèmes mal posés (voir 
Tykhonov et Arsénine [38]). La théorie mentionnée se rapporte en général 
aux équations dans les espaces de dimension infinie (par exemple, aux 
équations aux dérivées partielles). 

Dans le cas des espaces de dimension finie, la nécessité d’introduire les 
fonctionnelles de régularisation ne se présente pas directement. Toutefois, 
notons que pour des systèmes d’équations algébriques linéaires, le rôle de 
fonctionnelle de régularisation peut être joué par la fonction 


f\ Æ,b,A) = Nb — AEN? + X21EN? 


définie sur l’espace arithmétique ,. Cherchons la valeur de £ pour 
laquelle elle présente son minimum. La fonction f, peut être écrite d’une 
autre façon : 


f, (&,b,A) = '(b — AE — AE) + N'(E)E. 
Cherchons la différentielle en £ de cette expression. Il vient 
df, (£,b, A) = —2d'£ ‘Ab + 2d'£ 'AAE + 21° d'££. 
La différentielle s’annule pour les matrices-colonnes £ vérifiant le système 
d’équations qui coïncide avec (12). On a vu plus haut que le déterminant de 


la matrice du système est différent de zéro et que le système possède une 
solution unique (13) pour tous b, 4 et À +# 0. 
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Désignons cette solution par £,, et soit J\(£,,b, A) = ÿ. Si IE > 
> VF/N, on obtient f,(£,b, A) > £. Il s'ensuit que sur la sphère de rayon 
Vt/X + let en dehors d’elle, f, prend des valeurs strictement supérieures à 
ÿ. Si £, ne tombe pas à l’intérieur de la sphère, augmentons son rayon 
jusqu’à I£,Ï + 1. On obtient ainsi une sphère contenant £, et telle que 
pour tous les points situés sur la sphère et en dehors d’elle on a 
f.(E,b,A)> +. Comme la fonction /, est continue et possède un point sta- 
tionnaire unique à l’intérieur de la sphère, ce point est le point de son mini- 
mum. Les raisonnements donnés montrent que c’est un minimum absolu. 

La proposition 5 veut dire en fait que pour À — 0, le point où la fonc- 
tionnelle de régularisation atteint le minimum tend vers la pseudo-solution 
du système AË = D. 


$ 3. Méthodes de calcul 


1. Recherche de la pseudo-solution par décomposition singulière. La 
plus grande partie du chapitre XIII a été consacrée aux systèmes d’équa- 
tions linéaires à matrices carrées régulières, plus précisément aux systèmes 
dont les matrices ne sont pas quasi singulières. Toutefois, les problèmes 
réels ne garantissent pas en général des matrices régulières et, à plus forte 
raison, des matrices suffisamment bien conditionnées. (Font exception cer- 
tains systèmes d’équations linéaires dont les matrices sont de forme spé- 
ciale.) Pour vérifier si une matrice est bien conditionnée, il faut, comme on 
l’a vu, autant d'efforts que pour résoudre le système. 

Aussi, au cas où il est bien probable que la matrice du système 


Ax =D (1) 


est quasi singulière, peut-il s’avérer préférable de rechercher aussitôt la 

pseudo-solution de ce système. On minimise la norme de l’écart. Si le mini- 

mum s'avère suffisamment petit, on considère qu’on a trouvé une solution, 

sinon on pose qu’on a une pseudo-solution et que la solution n’existe pas. 
Il faut toutefois se rappeler que si la solution du système normal 


‘AAx = 'Ab (2) 


n’est pas unique, la pseudo-solution normale est celle des solutions de (2) 
qui a la plus petite norme. Aussi peut-il s’avérer nécessaire de rechercher 
une autre solution du système normal. 

Une grande partie de recommandations données pour résoudre les 
systèmes d’équations linéaires de forme générale prévoit de rechercher la 
décomposition singulière de la matrice du système ou de procéder à des 
opérations se réduisant en fait à cette dernière recherche. Si dans le système 
(1) on porte, au lieu de la matrice À, sa décomposition singulière, on 
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obtient le système 


(UDVx = b, 
ou 
Dy = b, (3) 
avec 
b = Vx (4) 
et 
b = Ub. 
Le système normal (2) peut de même être reduit à la forme 
D?y = Db. (5) 


En tenant compte de la forme de la matrice D, on trouve 
Dy = ‘la, y',.…,a,y", 0, Ol, 


OÙ æ,, .…, @, Sont les nombres singuliers non nuls de la matrice À. Il est évi- 
dent que pour la compatibilité du système (3) il faut et il suffit que 


b'ti= . =b"=0. 
A cette condition, la matrice-colonne 
Mar lbl,...,a1br",yrtt, pri (6) 


est sa solution quels que soient y”*!, .…, y". Mais indépendamment de la 
compatibilité du système (3), la matrice-colonne (6) est la solution générale 
du système normal (5). La pseudo-solution normale, c’est-à-dire la 
matrice-colonne de norme minimale parmi les matrices-colonnes de la 
forme (6), est alors égale à : 


Yo = las 'bl,..,ar!b",0,...,01. (7) 


Ainsi donc, la solution générale du système (5) (qui coïncide avec la solu- 
tion générale du système (3) si ce dernier est compatible) est de la forme 


Y = Yo + Cest ee + Cren = Yo + Er "C, 


où c est une matrice-colonne quelconque à ñn — r éléments, et E77” une 
matrice formée à partir des ñn — r dernières colonnes e,,,, ..., e, de la 
matrice unité d'ordre n. 

Utilisons la formule (4) pour passer à la solution du système (1). On 
peut écrire 


x = ‘Vy = ‘Vy, + ‘VE "ce. 
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Notons que la multiplication par une matrice orthogonale ‘V ne modifie 
pas la norme de la matrice-colonne, de sorte que la matrice-colonne x, = 
= ‘Vy, est de norme minimale et par suite, est la pseudo-solution normale 
du système (1). De plus, il n’est pas difficile d’établir que la matrice ‘V" = 
= VE" est formée des ñn — r dernières colonnes de la matrice "V. Ainsi, 
la solution générale du système (2) peut être écrite par la formule 


x =xo+'V'e, 


où x, est la pseudo-solution normale égale à ‘Vy,, et c est une matrice- 
colonne quelconque à ñ — r éléments. 

Ainsi donc, si la décomposition singulière de la matrice du système (1) 
est connue, il devient facile d’obtenir la pseudo-solution normale de ce 
système, ainsi que sa solution générale si le système est compatible. 

Il faut remarquer de plus que la recherche de la décomposition singu- 
lière est un processus beaucoup plus laborieux que la résolution du 
système, par exemple par la QR-décomposition de la matrice. L’obtention 
de la décomposition singulière sera étudiée au point 8 du présent paragra- 
phe. 

2. Utilisation de la régularisation. Une autre approche à la recherche de 
la pseudo-solution d’un système d’équations linéaires s’appuie sur la régu- 
larisation de sa matrice ou, plus simplement, sur l’utilisation de la proposi- 
tion 5 du $ 2. A savoir, pour approximation de la pseudo-solution du 
système (1), on prend la solution du système d’équations linéaires 


((4A + N°'E)x = ‘Ab, (8) 


avec une valeur convenable du paramètre À. Dans la proposition 5 du $ 2 
on a montré que, si les données initiales sont précises et que les calculs 
soient réalisés exactement, la solution x, de ce système tend pour À — 0 vers 
la pseudo-solution x, du système (1). 

Or pour des À petits, la matrice du système devient en général mal con- 
ditionnée. Par conséquent, si les données initiales et les calculs sont enta- 
chés d’erreurs, la valeur calculée X, de la solution x, peut différer fortement 
de celle de x, . 

Etudions l’influence des perturbations de la matrice À et de la matrice- 
colonne des termes constants b sur la solution du système (8). Soit donné le 
système perturbé 


Ax = b, 
où la matrice À et la matrice-colonne des termes constants b vérifient les 
inégalités 
LA — A <6ô, Hb-bl <5 (9) 


(on considère la norme spectrale de la matrice). 
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Soient x, la solution du système (8) et x, la solution du système 

(À À + X?E)x, = ‘46. 

Estimons la norme de la différence x, — x,. De l’égalité 
(AA + À2E)x, — (AA + X?E)x, = ‘Ab — 'Ab, 

par des transformations simples on obtient 
((4A + X?E)(x, — x,) = 

= (44 — '4AÂ)x, + (À — 'A)b + 'A(b — b), 
ou 
x, — x, = (AA + NE)! [(AA — ‘AA )x, + 

+ (À — A) — b) + (À — ‘A)b + 'A(b — b)]. (10) 
Pour tout x de norme égale à 1, il vient 
x (À À + A2E)x = '(Ax) Àx + N'(x)x > N2. 

Il s’ensuit en vertu de la proposition 4 du $ 2, ch. XI, que les nombres 
caractéristiques de la matrice ‘À À + À?E sont supérieurs à À? et que les 
nombres caractéristiques de son inverse sont inférieurs à À” 2. Etant donné 
que pour une matrice symétrique les nombres singuliers sont égaux aux 


modules des nombres caractéristiques, le plus grand nombre singulier de 
(AA + N?2E)7! ne dépasse pas À7?. Donc, 
144 + A2EÏ-!< ÀX72. 

Pour la norme spectrale de la matrice 44 — ‘A A,ona 
144 — ‘À AI < 1'4A — 'AAN + l'AÀ — 'AAI < 
< LA — AN (AN + LAN) < A — AN (21AN + 14 — AN) < ôc + 62. 
On s’appuie ici sur le fait que la norme spectrale ne varie pas par transposi- 
tion, ce qui résulte des propositions 6 et 14 du $ 1, ch. XI. Notons que le 
nombre c = 2H AÏ n’est défini que par la matrice A. 


En se servant des estimations pour les normes des matrices figurant 
dans l’égalité (10), on obtient 


LE, — xl < X72[(ôc + 62?) Ex, + 6? + SIDE + LAN 6]. 


Etudions x, = À * b qui est la pseudo-solution du système (1). D’après 
la proposition 5 du $ 2,x, — x, pour À — 0. Aussi, pour des À proches de 
zéro, la norme de x, est-elle bornée. D’où 


: Ô 
Lx, — x, l < ;zP(G, À), (11) 
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où p est une fonction bornée au voisinage de zéro, qui ne dépend pas de À 
et D. 
Majorons la norme de la différence x, — x, : 


Lx xl < 14* — (44 + AE)! (A): lon. 


Pour calculer la norme de la matrice B = 4A* — (‘AA + \?E)-!('A), 
considérons des matrices orthogonales U et telles que D = ‘UA V soit une 
matrice diagonale. En remplaçant À par UD'V, on obtient B = V(D* — 
— (D? + \2E)-'D)'U, d'où IBl = ID* — (D? + \?E) D. La 
matrice D* + (D? + X?2E)7 !D est diagonale et ses éléments non nuls sont 
al — aa? + N°)" !,i = 1,...,r. Le nombre r est ici égal à Rg À, tandis 
que à; sont les nombres singuliers non nuls de la matrice À. Selon le théo- 
rème 2 du $ 1, ch. XI, les éléments diagonaux de la matrice D* — (D? + 
+ À2E)7 D sont ses nombres singuliers. Le plus grand d’entre eux est égal 
à la norme spectrale de la matrice, de sorte que 


——— \° se 
a,(@? + À?) 


LA+ — (AA + X°E) (CA = a7! — a (œ? + À2)7! = 


Donc, 
X2IbH - X°lbl 


see € — = }°?q, 12 
a, (a? + À?) a? e. 04 


où g est une constante. 
Maintenant, en s’appuyant sur les majorations (11) et (12), on obtient 


: _ 6 - 
1x —x IS IX, —-xl+lx, - xl < xzP(8, À) + À°q. (13) 


Admettons que la précision à des données initiales soit fixée. Alors, 
lorsque À décroît, le premier terme dans la majoration (13) augmente et le 
second terme diminue. Il est donc possible de choisir une valeur de À mini- 
misant Lx, — xl. 

La formule (12) permet de majorer la fonction p(ô, À). En effet, il 
découle de (12) que 

Lx, < Lx,l + 29. 
En portant cette expression dans celle de p(ô, À), on obtient 
p(ô,À)< (c + 8)(xN + X?g) + (bl + LAN + 5) 6 = 
= c'+c"ô + q(ce + 6) X’, 


où c’et c”” sont des constantes strictement positives. Donc, 


2 PG, À) < EC + cc” ô) + ôg(c + ô). 
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Si on en tient compte dans la majoration (13), on trouve que 
à Ô ; PA S 
Le, — xl < 5 (C + C 6) + ëg(c +8) +\g= ST +N\a+t. 


Cherchons la valeur de À? pour laquelle le second membre de l'égalité 
devient minimal. En dérivant par rapport à À2, on obtient l’équation 


— S + qg = 0 qui donne la valeur cherchée 


‘ v, 1/2 
À? = PS (==) | (14) 
q q 


On voit facilement que pour cette valeur de À? la norme de la différence 
x, — x, est une grandeur d’ordre V6. 

On ne discutera pas en détail la formule (14). Son importance n’est pas 
si grande vu que son second membre contient des inconnues ainsi que des 
quantités xl, &, et autres, difficilement calculables. Toutefois la formule 
(14) permet d’énoncer la proposition suivante. 


PROPOSITION 1. On peut trouver la pseudo-solution du système (1) avec 
une erreur d'ordre Vè, où à définit l'erreur sur les données initiales suivant 
les formules (9). 

3. Calcul de la matrice pseudo-inverse. On etudiera maintenant les 
méthodes de calcul pratique de la matrice pseudo-inverse. Toutes les diffi- 
cultés liées à la recherche de la matrice inverse d’une matrice régulière se 
conservent aussi dans ce calcul, mais il s’y ajoute d’autres difficultés. On a 
limité au chapitre XIII la classe des matrices en posant que les matrices étu- 
diées ne sont pas quasi singulières. Ici on ne peut imposer à une matrice de 
telles restrictions, de sorte qu’il se pose le problème de définir le rang de la 
matrice. Il a été noté à la p.382 que si on tient compte des erreurs 
d’arrondi et des erreurs sur les données initiales, le rang de la matrice ne 
peut être établi avec certitude pour toutes d’entre elles. Or le résultat des 
calculs dépend essentiellement de la valeur du rang de la matrice donnée. 
Considérons l’exemple suivant. 


Soit 
— h 0 
O0 107 
Alors 
A. | (0 
O 10% 
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Si on néglige l’élément 107%, on obtient la matrice 


»-[! 9 

0 O0 
et sa pseudo-inverse 

8 |, 4 

0 0 


qui diffère sensiblement de À -!. 

L’accroissement de précision et une meilleure sélection d’algorithmes 
peuvent restreindre la classe des matrices de rang indéterminé, mais ce pro- 
blème n’a pas de solution de principe. 

Dans l’exposé qui suivra, on supposera, en s’appuyant sur certaines 
considérations liées peut-être à la position du problème où il a fallu calculer 
une matrice pseudo-inverse, qu’on est en mesure d'établir le rang de la 
matrice donnée. 

Dans la plupart des cas, les méthodes de recherche de la matrice 
pseudo-inverse d’une matrice donnée À s’appuient sur la décomposition de 
A en produit de facteurs. Les propositions 8 et 10 du $ 1 nous offrent deux 
cas, où de À = BC on obtient 4 = C‘B*. Ces cas-là sont utilisés dans 
les calculs. | 

4. Obtention directe de la décomposition squelettique d’une matrice. 
Cette décomposition a été définie au point 3 du $ 1. La proposition 10 du 
$ 1 nous montre comment elle peut être utilisée à la pseudo-inversion de la 
matrice. Voyons comment cette décomposition peut être obtenue. 

Soit une matrice À à m lignes et nr colonnes. S’il est établi que cette 
matrice est de rang r, ses r colonnes peuvent être transformées par des opé- 
rations élémentaires sur les lignes en r premières colonnes de la matrice 
unité. Soient j,, .…, j, les numéros des colonnes principales. On négligera, 
par hypothèse du rang de la matrice, les éléments des m — r dernières 
lignes. 

Désignons par C la matrice de type (r, 7) composée des r premières 
lignes de la matrice transformée. 

Soit B la matrice de type (m,r) composée des colonnes de la matrice À 
de numéros j,, .…,/j,, autrement dit des colonnes principales. Il s’avère que 


A = BC 


et que cette décomposition est squelettique. 

En effet, les colonnes principales (de numéros j,, .…,,) de la matrice C 
sont les colonnes de la matrice unité d’ordre r. Aussi les éléments de la 
j-tème colonne de C sont-ils les coefficients dans la décomposition de cette 
colonne suivant les colonnes principales. Or on sait que les relations linéai- 

31 — 6442 
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res entre les colonnes de la matrice sont invariantes par les opérations élé- 
mentaires sur les lignes. Donc, la j-ième colonne de la matrice À se décom- 
pose suivant ses colonnes principales avec les mêmes coefficients. Il ne reste 
qu’à se rappeler que la j-ième colonne du produit BC est une combinaison 
linéaire des colonnes de B avec les coefficients égaux aux éléments de la 
j-ième colonne de C. 

Ce procédé d’obtention de la décomposition squelettique présente plu- 
sieurs défauts évidents : il oblige de prendre une décision sur la petitesse des 
m — r dernières lignes de la matrice transformée. De plus, le calcul de la 
matrice pseudo-inverse suivant la formule de la proposition 10, $ 1, néces- 
site un grand nombre d’opérations arithmétiques et, à ce qu’il paraît, il n’y 
a aucune possibilité de se servir de la matrice de transformation obtenue 
avec la décomposition de la matrice À. La matrice B ne présente aucune 
structure spéciale outre l’indépendance linéaire de ses colonnes. Quant à la 
matrice C, on expliquera plus loin au point 7 comment on peut utiliser sa 
structure spéciale. 

S. La OR-décomposition des matrices rectangulaires. Rappelons que 
pour trouver la OR-décomposition des matrices carrées par la méthode des 
symétries étudiée au $ 3 du ch. XIII, on a successivement transformé les 
colonnes de numéros 1, 2, 3, etc. de la matrice en des colonnes correspon- 
dant à la forme triangulaire supérieure. Chaque transformation représen- 
tait la multiplication à gauche par une matrice de symétrie et ne modifiait 
pas la forme des colonnes déjà transformées. Si la i-ième colonne de la 
matrice était une combinaison linéaire des colonnes précédentes, ses élé- 
ments situés sur la diagonale et au-dessous d’elle s’annulaient après les 
transformations de ces colonnes. Une telle colonne ne nécessitait plus de 
transformation, et on omettait le facteur correspondant. 

Le fait que la matrice qu’on transformait était carrée ne jouait au fond 
aucun rôle dans le processus. En transformant de la sorte une matrice À de 
type (m1, n), on obtient la décomposition 


A =@R, 


où Q est une matrice orthogonale d’ordre m, et R une matrice de type 
(m, n) dont les éléments »;; satisfont à la condition p;;, = 0 pour i > j. On 
dira que cette décomposition est la Qr-décomposition, en se servant de la 
lettre 7 pour rappeler que la matrice R n’est en général pas carrée. 

On obtient une autre généralisation de la QR-décomposition si l’on se 
souvient de la OR-décomposition par la méthode d’orthogonalisation de 
Gram-Schmidt (voir p. 422). Soit À une matrice de type (m, n), avec m > 
> n,et soit Rg À = ñ, ce qui veut dire que les colonnes de À sont linéaire- 
ment indépendantes. En assimilant ces colonnes à n vecteurs de l’espace 
m-dimensionnel, on peut leur appliquer la méthode d’orthogonalisation et 
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construire une matrice triangulaire supérieure U, telle que les colonnes de 
la matrice Q = AU soient orthogonales et normées par rapport au produit 
scalaire ordinaire dans l’espace des colonnes. Ainsi, la matrice Q de type 
(m, n) peut être considérée comme sous-matrice d’une matrice orthogonale 
d’ordre m. Désignons U”! par R et l’on obtient la décomposition À = QR, 
où R est une matrice triangulaire supérieure carrée d’ordre n et Q la matrice 
décrite plus haut. Cette décomposition sera appelée gR-décomposition. 

A la p. 422 on a noté que le processus d’orthogonalisation de Gram- 
Schmidt exposé sous sa forme habituelle n’est pas stable par rapport aux 
erreurs d’arrondi. Vu l’importance de la gR-décomposition pour la 
pseudo-inversion des matrices, et du processus d’orthogonalisation pour la 
qR-décomposition, on étudiera ici la méthode d’orthogonalisation modi- 
fiée ayant une plus grande stabilité. 

6. Méthode de réorthogonalisation. Supposons qu’on doit orthogonali- 
ser ñn matrices-colonnes à m éléments :a,,...,a,(m > n). On sait que la 
méthode usuelle consiste à remplacer la première matrice-colonne par g, = 
= a,/la,l, où Î * Îl est la norme euclidienne. Ensuite, sig,, .…,q, sont déjà 


construites, on pose 
k 


u—=da,,,— y C;q;; 


im] 


où les coefficients c; doivent vérifier les conditions ‘q,u = 0, .….,'q,u = 0. 
Ces conditions peuvent être écrites sous forme d’égalités 


k 
D c;:(g;)q; = q;a,,: (15) 


im) 


pour tous les / = 1, .…,k. Notons l la matrice de ce système d’équations 
linéaires, c’est-à-dire la matrice d’éléments ‘g;g; Si les calculs sont faits 
exactement, les matrices-colonnes qg,, ...,g, sont orthonormées, l° est une 
matrice unité et c; = ‘g;a,,,, d’où 


k 
u=a,;— Y (g;a,1)g; (6) 
im] 


Ensuite, on pose g,,, = u/lul et on passe au calcul deg, ,. 
Cependant, si les calculs sont effectués de façon approchée, T n’est 
qu’une approximation de E et c, = ‘ga,,, n’est déjà plus solution du 
système (15). Ceci étant, le processus décrit plus haut aboutit au système 
des matrices-colonnesg,, ...,g, qui, avec une grande précision, engendre le 
même sous-espace que a,, …, a,. L’instabilité notée plus haut de la 
méthode d’orthogonalisation se traduit dans le fait que les matrices- 
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colonnes calculées g; peuvent s’avérer de loin non orthogonales et l’altéra- 
tion due aux erreurs d’arrondi est d’autant plus grande que les matrices- 
colonnes a; sont plus proches des colonnes linéairement dépendantes. Pour 
éviter cet inconvénient, on doit résoudre le système (15) sans exiger que les 
matrices-colonnes calculées g; soient orthonormées. Dans ce cas, les erreurs 
introduites avec le calcul deg,, …,g, n’influent pas si fortement sur le cal- 
cul de g,,,. On peut se servir de la méthode itérative simple (comp. $ 4, 
ch. XIII), qui converge ici rapidement, vu que la matrice l est proche de la 
matrice unité. 

On décrira ici le procédé de construction de la matrice-colonne q, , ,, 
appelé méthode de réorthogonalisation. 

Soit u la matrice-colonne obtenue par la formule (16) et qu’on suppose 
non orthogonale à g,, ..…,gq,. On la note ul) et l’on construit la matrice- 
colonne 4 ©) suivant la formule 


k 
uM=um— S (qut)g;. 
i=) 


D'une façon générale on peut construire la suiteu(® = a,, ,,utl,u tt), …. 
en accord avec la relation de récurrence 


k 
us+l) = uyts) — y (q;u S))q.. (17) 


im=i 


Considérons pour un terme arbitraire de cette suite le produit ‘g ;uS* D 
pour un < & On a 


k 
quSt0 = qu — Y (qu) ag;g;). 
is] 
Cela signifie que la matrice-ligne 
ps+) es lg, usti) .. q,uS+U 


vérifie la relation 
pS* 1) — p'S(E _— rl). 
La suite dep () converge vers la matrice-ligne nulle et de plus très vite, car T 


est proche de £E. En effet, il ressort des propriétés de la norme euclidienne 
que ï 


IS+UU < INDE — TI, < la, ,NRE — TlEt!. 


Démontrons maintenant que la suite de u *? converge. En additionnant 
membre à membre les égalités de la forme (17) pour tous les s = œ, …, B, 
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on obtient 


k 
Pau N (quË 0 +... + qiuta)g,, (18) 


i-] 
d’où 


k 
Hu (9) — yo < >. lq;uB-D +... + qu@)l.lqil < 


s=a 


k 8-1 
< YO Y l'qutl-lgl. 
CR | 


En posant lg < 2 et en modifiant l’ordre de sommation, on obtient 
8-1 
$s=o 


Vu que la /-norme | #1, ne dépasse pas la norme euclidienne, on a 


B-1 


Lu) — gta < la, | D) LE — TS < 


ssa 


2la, , UNE — rist' 
1—HE -TI, 


Il n’est maintenant pas difficile de montrer que pour € > 0 donné, on peut 
trouver un numéro y de manière que lu (#) — ut) < €, dès que æ, B > +. 
Ainsi, on voit que la suite de u (5) satisfait au critère de Cauchy. 

Ensuite, en posant & = 0 dans la formule (18), on trouve que pour cer- 
tains coefficients c!{#? 


k 
uP=a,;- > cg: 
i=] 
Aussi la limite v de la suite {u 5)] vérifie-t-elle l'égalité 
k 


U=dy,;— Ÿ Ciqi 


im] 
où c; = lim c{#). Ceci montre que v # 0,sia, , , n’est pas une combinaison 
B—œ 


linéaire des matrices-colonnes a,, ..,a,. 
On a vu quep (5) — O0 (s — œ). Aussi la matrice-colonne v est-elle ortho- 


gonale à toutes les g,, ...,gq,. 
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Il va de soi que pratiquement au lieu de v on prend) de numéros suf- 
fisamment grand. Vu que la norme ÎLE — MA, est petite, la suite converge 
rapidement et on peut se limiter en général au calcul de u (). 

Après avoir construit avec une précision nécessaire la matrice-colonne v 
non nulle orthogonale aux matrices-colonnes g,, ...,g,, on pose g,,, = 
= v/Ilul et l’on passe au calcul deg, ,:. 

On avait supposé que les matrices-colonnes a,, , a, qu’on devait 
orthogonaliser étaient linéairement indépendantes. Laissons tomber cette 
hypothèse. Posons que la matrice-colonne a, , , s'exprime linéairement au 
moyen de a,, .…,a,. Alors la matrice-colonne correspondante v devient 
nulle. Elle ne peut pas naturellement être normée et on ne la joint pas à 
l’ensemble des matrices-colonnes orthonormées construites. A l’étape sui- 
vante, on procède à l’orthogonalisation de la matrice-colonnea, , , par rap- 
port aux matrices-colonnes g,, .., g, déjà existantes. 

Remarquons que si le rang de la matrice est inconnu, on doit chaque 
fois prendre une décision : peut-on admettre que la matrice-colonne v est 
nulle si ses éléments calculés sont de faible valeur. 

Toutefois, si cette difficulté est surmontée d’une façon quelconque, on 
peut trouver pour la matrice À de type (m,n),avecm > n, par la méthode 
d’orthogonalisation, la gR-décomposition À = OR, où R est une matrice 
triangulaire supérieure régulière et Q une matrice dont les colonnes non 
nulles sont orthonormées. Si m < n, les raisonnements demeurent les 
mêmes, sauf que la matrice Q contient nécessairement quelques colonnes 
nulles. 

7. Applications de la gR-décomposition. Montrons d’abord que la 
qgR-décomposition d’une matrice quelconque À permet d’obtenir sa 
décomposition squelettique. Posons pour simplifier les notations que les 7 
premières colonnes dans la matrice À sont principales. S’il n’en est pas 
ainsi, on peut toujours permuter les colonnes, ce qui n’entraînera selon la 
proposition 8 du $ 1 qu’une permutation des lignes dans la matrice À *. 
Ainsi donc, on pose que la matrice À est décomposée en blocs 


A = IB, Si, 


le bloc B étant de type (m, r) et de rang r. 

En calculant la gR-décomposition de la matrice À par orthogonalisa- 
tion, on aboutit à la matrice triangulaire régulière R d'ordre n, telle que 
AR = Q, où Q est de la forme 


Q _ 1Q,, ON, 


le bloc Q, étant composé der colonnes orthonormées. 
Toute colonne de numéro ; dans la matrice R est composée des coeffi- 
cients avec lesquels la colonne de même numéro ; dans la matrice Q se 
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décompose suivant les colonnes de la matrice À. Pour j > r, les colonnes 
de Q sont nulles. Aussi la j-ième colonne de la matrice R pour j > r peut- 
elle être prise sous la forme 


Mo; … Dj O …. 1 .… OÙ, 


OÙ Pis +. p,; Sont les opposés des coefficients qui figurent dans la décom- 
position de la j-ième colonne de À suivant les colonnes principales. Dési- 
gnons par R‘” la sous-matrice de la matrice R, formée à partir de ses n — r 
dernières colonnes. Il ressort de ce qu’il vient d’être dit que R ‘” est de la 
forme 


— U 
. | 

E;- 
où U est un bloc à r lignes et 7 — r colonnes. Vu que AR ” = O,ona 


B(-U) + S = O,ouS = BU. Il s'ensuit que À = IB, BU = BÎE,, UI, 
ou bien 


A = BC, 


avec C = ÎE,, UA. Cette décomposition est évidemment squelettique. 

Les matrices calculées R et Q permettent aussitôt d’obtenir la matrice 
pseudo-inverse pour le premier facteur de la décomposition squelettique. 
En effet, soit R; la sous-matrice de R, formée à partir de ses r premières 
lignes et colonnes. On vérifie aisément que 


BR, = Q,, 


où Q, est une sous-matrice composée des colonnes non nulles de la matrice 
Q. Cette décomposition est aussi squelettique. Donc, Of = (R;,)-'B* et 
B* = R,Q};. Or les colonnes de Q, sont linéairement indépendantes et 


‘O0; = E. Donc, Q' cu (‘Q,0,)"'('Q,) = Q.. Finalement, 
B* =R;(@,;). 


Pour trouver C *, il faut encore une fois recourir à la méthode d’ortho- 
gonalisation et rechercher une matrice triangulaire régulière Z d'ordre r 
telle que ‘CZ = P, où P est une matrice à colonnes orthonormées. Ceci est 
bien possible, vu que ies lignes de la matrice C sont linéairement indépen- 
dantes. En raisonnant alors comme dans le cas de B, on obtient 


(C)* = Z'P 


et 
+ = P'Z. 


Notons en conclusion qu’on a utilisé pour les matrices À et C le résultat 
d’orthogonalisation de leurs colonnes et non pas la gR-décomposition. Si 
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on connaît la gR-décomposition obtenue d’une autre façon quelconque, il 
ne reste plus que d’inverser la matrice triangulaire supérieure, ce qui ne pré- 
sente pas de grandes difficultés. 

8. Seconde forme de décomposition singulière. Le procédé le plus effi- 
cace, bien que relativement laborieux, de résolution des problèmes liés à la 
recherche de la pseudo-solution normale et à la pseudo-inversion des matri- 
ces, est l’obtention de la décomposition singulière. En maintes occasions, 
la recherche de la décomposition singulière peut remplacer la recherche de 
la matrice pseudo-inverse. La décomposition singulière introduite au $ 1 
du ch. XI peut revêtir une autre forme qu’on va étudier. 

Désignons par E7 une matrice de type (r, ñn) composée des r premières 
lignes de la matrice unité d’ordre #7. Quelle que soit la matrice Ÿ, le produit 
E7V (s’il est défini) est composé des 7 premières lignes de la matrice V. Si le 
produit SE’ est défini, il représente la matrice S, à r colonnes de laquelle 
viennent se joindre à droite 7 — r colonnes nulles. 

Considérons une matrice À de type (m, ñn) et de rang r. Sa décomposi- 
tion singulière est de la forme À = ‘UD, où D est une matrice diagonale 
de type (m, n) dont la forme est 

h O 
oO ol 


avec À une matrice diagonale carrée d’ordre r. La matrice D peut être 
représentée sous forme de produit '(E” )AE”. Alors, 


A = 'U'(EL)AES V = (ESU)A(E: V). 


Selon ce qui a été dit plus haut, E7V est une matrice composée des r premiè- 
res lignes de V, et '{E7 U) est une matrice composée des r premières colon- 
nes de la matrice ‘U. Désignons ces matrices respectivement par , et 'U.. 
Les lignes de F, et U, (colonnes de ‘U,) sont orthonormées. On a obtenu la 
décomposition 


A ='U,AV,, (19) 


qu’on appellera seconde forme de décomposition singulière. 

La seconde forme de décomposition singulière contient des matrices de 
moindres dimensions que les matrices de la première forme : il n’est pas 
nécessaire de calculer et de retenir les composantes des vecteurs de bases 
singulières, qui correspondent aux nombres singuliers nuls. 

Donnons une interprétation sommaire de la décomposition (19) en ter- 
mes d’applications linéaires. 

Soient &, et é,, des espaces euclidiens et À une application linéaire de €, 
dans &’,. Définissons le projecteur orthogonal de &, sur Im À* comme une 
application P : 6, — Im A* associant à chaque vecteur x € é’, sa projection 
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orthogonale sur Im AÀ* (comp. point 4, $ 3, ch. XII). Si & et Im A* sont 
rapportés à des bases choisies, l’application P se définit par une matrice P 
de type (r, ñn). 
Vu que (Im A*): = Ker À, on a pour tout x € é, 
A(x) = A cP(x). 


On le vérifie facilement en écrivant x sous la forme x’ + x’’,oùx’°€ 
e Im A'etx”e Ker A. 

Considérons la restriction À, de l’application À au sous-espace Im A*. 
Selon la proposition 1 du $ 2, À, est une bijection de Im A* sur Im A. Soit 
en outre Î l’injection canonique de Im À dans &. (voir pour plus de détails 
sur cette application p. 352). On peut maintenant représenter l’application 
A sous forme de produit 


A=IlcA,cP. (20) 


L'expression matricielle de ce produit devient possible après le choix de 
quatre bases dans les espaces &,, Im A*, Im À et &,. Rapportons les espa- 
ces €, et 6’, à deux bases orthonormées quelconques et notons À la matrice 
de l’application À par rapport à ces bases. Ensuite, rapportons les espaces 
Im A* et Im À à deux bases formées respectivement des vecteurs de la pre- 
mière et de la seconde base singulière de À, correspondant aux nombres 
singuliers non nuls (il y a exactement r vecteurs dans chaque base). La 
matrice À de l’application À, par rapport à ces bases est une matrice diago- 
nale avec nombres singuliers non nuls sur la diagonale. 

Il est évident que dans les bases ainsi choisies la matrice de l’application 
| présente des colonnes orthonormées. En passant dans l’espace 6’, à la 
seconde base singulière, on peut constater que pour la base choisie dans 
Im A l’application P a pour matrice E”,. Donc, pour la base initiale dans 
6, la matrice de P, égale à FE”, V, possède des lignes orthonormées. 

Ainsi, la seconde forme de décomposition singulière peut être obtenue 
comme une expression analytique de la décomposition (20). 


REMARQUE. En rapport avec la décomposition (20), il faut noter que 
dans la définition de l’application pseudo-inverse, faite au début du $ 2, il 
aurait fallu écrire devant A; ! l'injection canonique | de l’espace Im A* 
dans &,. On s’abstient de le faire vu que dans ce cas, comme ‘dans les 
autres, aucune difficulté ne se présente si cette injection est tout simple- 
ment sous-entendue. Mais il arrive des situations (dont l’une vient d’être 
rencontrée) quand l’introduction de ce facteur « auxiliaire » rend la situa- 
tion plus claire. 

La voie la plus naturelle de construction de la décomposition singulière 
d’une matrice À est de résoudre complètement le problème des valeurs pro- 
pres pour la matrice ‘44. Mais pratiquement cette voie est peu acceptable. 
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En effet, la recherche de la décomposition singulière pose l’un des plus 
importants problèmes d’existence du nombre singulier nul et de sa multipli- 
cité. Si les nombres singuliers sont obtenus comme racines carrées des nom- 
bres caractéristiques de ‘44, la résolution du problème se complique car les 
carrés des nombres singuliers sont plus difficiles à distinguer de zéro que les 
nombres eux-mêmes. De plus, le calcul de la racine carrée des nombres pro- 
ches de zéro est entacheé de l’erreur relative très grande. 

Si la matrice ‘44 est tout de même utilisée, il découle de ce qu’on vient 
de dire que les éléments de cette matrice doivent être calculés avec une très 
grande précision. | 

Aussi en pratique (voir Forsythe, Malcolm et Moler [11], Wilkinson et 
Reinsch [43]) utilise-t-on la méthode qu’on décrira pour le cas de m > n. 
(Pour m < n,la même méthode peut être appliquée à la matrice transpo- 
sée.) 

D'abord, par la méthode des symétries, on construit des matrices ortho- 
gonales U et V telles que la matrice 4° = ‘UAV soit bidiagonale, c’est-à- 
dire que ses éléments a{° peuvent ne pas être nuls sii = j oui + 1 = j. La 
réduction à la forme bidiagonale ne diffère en rien de celle qui a été décrite 
pour les matrices carrées au $ 5 du ch. XIII. 

Ensuite, on transforme la matrice 4° par des matrices orthogonales 
SK), PK), k = 0,1, 2, .…, suivant les formules 


AUK+D =.SÙ) AU) pu) 


Les matrices S%), P(X) sont choisies de manière que la suite de A) con- 
verge vers la matrice diagonale D. Ceci êtant, chaque matrice 4%) est 
bidiagonale et a!*} , — O pour k — o. 


SiS = lim S%) ... SOet P = lim P%) ... PO), on a D = SUAVP et la 


k—@® 
décomposition À = ‘(SU)D'(VP) est une décomposition singulière de À. 
Etudions maintenant les matrices S(X) et P#), Chacune d’elles est le pro- 
duit de matrices de rotation d’un plan : 


SH = 5, ..sS 


n 
et 
PW = P,,...P,, 


S; et P,; étant des rotations du plan engendré par e._, ete. Ces rotations 
sont choisies de manière que la matrice B%) = 44%) 4%) se transforme en 
matrice B%+) = ‘PB P) qu'on obtient de B%) en une étape du 
QR-algorithme avec décalage. Cependant, les matrices S; et P; ne peuvent 
être trouvées que d’après les éléments de la matrice À %), quant à la matrice 
B%), elle n’est ni utilisée ni calculée. 
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Tout comme le QR-algorithme, ce processus itératif converge rapide- 
ment et fournit un résultat exact. 

9. Utilisation de la décomposition singulière. En groupant les facteurs 
dans la seconde forme de décomposition singulière : 


A = ‘U,(AV.), 


on obtient la décomposition squelettique de la matrice 4. En effet, les 
matrices ‘U, et AV, sont respectivement de type (m, r) et (r, n), de sorte 
qu’on peut écrire À * = (AV,)*('U,)*, d’où 4* = (AV,)*U, car les 
colonnes de la matrice ‘U, sont orthonormées. 

Soit B = AP,. Cette décomposition de la matrice de type (r, 7) en pro- 
duit des matrices de type (7, r) et (r, ñn) et de rang r est squelettique. Par 
conséquent, B* = VA"! = 'V,A-!et, en définitive, on a 


A* ='V AT! U.. 


Si l’on a obtenu la décomposition singulière de la matrice À, cette for- 
mule permet de passer à la pseudo-inverse de À presque sans calculs supplé- 
mentaires. Il va de soi que la décomposition singulière est plus difficile à 
obtenir que par exemple la gR-décomposition, mais du point de vue des 
calculs, elle présente d’importants avantages. A savoir, on a déjà souligné 
plusieurs fois que le problème le plus difficile dans la pseudo-inversion des 
matrices est celui de la détermination du rang de la matrice. Ce problème 
n'apparaît pas si on utilise la décomposition singulière. 

Il se pose un autre problème beaucoup plus simple, quand il faut déci- 
der si un nombre donné est suffisamment petit pour qu’on puisse le négli- 
ger. Plus précisément, lesquels des nombres singuliers calculés sont en réa- 
lité nuls. 

Pour chaque problème concret, en tenant compte de l’estimation de 
l'erreur sur les données initiales ainsi que de celle des erreurs d’arrondi 
introduites par le calcul des nombres singuliers, on fixe certain nombre € en 
guise de frontière : tout nombre singulier inférieur à € est considéré comme 
nul. 

Ainsi, les dimensions des matrices dans la décomposition calculée (19) 
dépendent de la valeur de €. Cette décomposition est la décomposition 
exacte d’une autre matrice À,. Le rang de À, dépend de €. Ceci étant, 
Rg À, < Rg À et le nombre conditionnel spectral vérifie l’inégalité 


c(4,) < ©! < c(4), 


où à, est le plus grand nombre singulier de la matrice À. 
On voit que la matrice À, est en général mieux conditionnée que À, 
mais une partie de l’information contenue dans À peut se perdre. Si l’on 
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admet comme nul un nombre singulier dont la valeur exacte est strictement 
positive, on admet par là même qu’une ligne de À est linéairement dépen- 
dante des autres. Donc, en rendant € plus grand que le nombre singulier 
minimal de À, on choisit dans À l'information la plus certaine dont la 
quantité est naturellement moins grande. Simultanément, en augmentant €, 
on rend les notations plus simples et, partant, on économise la mémoire. 

On peut utiliser ce résultat pour dégager la plus essentielle partie des 
données contenues dans la matrice. On rend pour cela € suffisamment 
grand pour obtenir la matrice À, de rang admissible, à savoir : suffisam- 
ment petit pour que les données puissent être embrassées et suffisamment 
grand pour qu'elles présentent un intérêt. 

10. Méthode de Gréville. Une toute autre approche à la recherche de la 
matrice pseudo-inverse s’appuie sur la construction suivante. 

Supposons que la matrice À, est déduite de la matrice À par l’adjonc- 


tion à droite la matrice-colonne « : 


d) ::10,: à 

Admettons d’abord que 4A *æ # æ et considérons la matrice-colonne 
8 = (E — AA* ja 

ICE — AA* al?” 


où 1 x est la norme euclidienne. 


(21) 


PROPOSITION 2. Si AA*æœ +# «, la matrice A; se déduit de la matrice 
A*(E — æœ'B)par l’adjonction en bas de la ligne 'B, c’est-à-dire est de la 
forme 

A'(E-af) 
| 8 | | (22) 


On le démontre le plus facilement en vérifiant les conditions de la pro- 
position 12, $ 1 pour la matrice (22). En la notant X, on obtient 


A, X = A, al | Sa - 


= AA*(E - aB) +a'B = AA* + (E — AA*)af$. 


Pour abréger les notations, désignons le dénominateur de l’expression (21) 
par À. Alors, 
A,X = AA* + (E - AA*)aæ'a'(E -— AA*t)X°!, 


d’où l’on voit que la matrice 4,X est symétrique. 
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Considérons maintenant le produit 4,XA,. On a 
._ A, XA, = A) X HA, aœl = 14, XA, À, Xal. 
Calculons la matrice 4, XA. Elle est égale à 
AA*A + X\7!(E — AA*)aæ'æ (E — AA*)A, 
car E — AA* est symétrique, tout comme 44 *. 


Le premier terme vaut 4. Chassons les parenthèses dans le second 
terme : 


(E — AA*)æœ'a (E — AA‘) A = 
= @œ'a À — AA* œ'æ À — a'œ AA*A + AA*' œ'œ AA‘'A 
et l’on voit qu’il est nul en vertu de l’identité 44 * À = A. 
Calculons maintenant la matrice-colonne À , Xæ. Elle vaut 
AA* æ@ +X7!(E — AA*)a'a(E —- AA* )a. (23) 
Pour simplifier cette expression, cherchons À : 
X = (a(E — AA*YXE — AA* ja = ‘@(E — 2AA* + (AA*}}aæ = 
= ‘a(E — AA* )æ. 
En simplifiant l'expression (23), on obtient 
A, ,Xa = AA*a +(E - AA‘)a = a. 
Donc, 4,XA, = 1A,aæl = À,, ce qu’il fallait démontrer. 


Ensuite, on peut vérifier que la matrice XA, se décompose en blocs sui- 
vants (qui sont des matrices de type (n, 7), (n, 1), (1, n) et (1, 1)) : 


+ = St + «1 
XA = | Es B)A A gi C4) 
Un calcul analogue au précédent montre que 
XA, = | + A ‘|. 
0 | 


et l’on voit que cette matrice est symétrique. En outre, en multipliant cette 
matrice par X, on obtient immédiatement X4,X = X. La proposition est 
démontrée. 
Voyons maintenant le cas où 4A *æ = «. Posons 
__((4*)4*a 


mem 25" 
1 + 1A4*aœl?2 y 


Y 


et démontons la 
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PROPOSITION 3. Si AA*@æœ = @, la matrice A; se déduit de la matrice 

A*(E — œ‘y) par l’adjonction en bas de la ligne y, c’est-à-dire vaut 
A*(E - 

| ( | a . C6) 


Par analogie à la proposition précédente, la démonstration consiste à 
vérifier les conditions de la proposition 12 du $ 1. Notons X la matrice (26) 
et calculons 4, X : 


A, À = |A, al [ SP = AA*(E-ay)+a'y = AA* 


en vertu de la condition ÀA * æ = @. Ainsi, la matrice 4, X est symétrique. 
De façon analogue, indépendamment de la forme de y, on a 


A, XA, = AA* A, = H1AA* A4, AA* al = 14, al = À.. 
Calculons la matrice XA ,. Elle est de la forme (24), à la seule différence 


qu'au lieu de 8 on a y. Transformons les expressions des blocs de cette 
matrice : 


At(E-æœ'y)A = At A — A*taæ'æ'(At)A* AX7!, 
où 
À =1+1A* aœl2. 
Or f{A*)A*A = ‘(A* )en vertu de l'identité (8) du $ 1. Donc, 
A*(E-aœ'y)A = A*A — (A*æj(æ '(4* ))X7! = 
= AA — X7!(Atæ)'(A*aæ). 
Il en découle que le bloc supérieur gauche est symétrique. Ensuite, en vertu 
de la même identité, 
YA = (œ (A*)A*AX ! = X-!((æœ)'(A*). 

En outre, 
A'E-aœaYy)e = A* a = À! A* a ‘æ (A) A+ æ = 
= À! (A t@r — A*ta 'æœ (A*)A*tæ) = X7![A4*a (1 + ‘æ'(A*)A*aæ) — 

— Ataæa'æ'(At)Ataæ] = "!'A*a. 
Cela montre que le bloc-ligne s’obtient par transposition du bloc-colonne. 


On voit maintenant que la matrice XA , est symétrique. Etudions le pro- 
duit XA ,X. Si Z;, avec i = 1,2, 3, 4, désignent les blocs de la matrice XA,, 
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XA X = ( Se | [” et | D (E-aæy)+2,(%) 


Z; Z4 Z;,A*(E-a%)+2,(%) | 


En portant, au lieu de Z;, leurs expressions en fonction de À, æ ety, on 
obtient 


Z,A*(E — æ%) + Z, (y) = 
= At(E- ay)AA*(E - œy) + A'(E - ay)a Y. 
Chassons les parenthèses et tenons compte de ce que 4A *æ = « et que 
ty AA* = y !(æœ)'(4*)A* AA* = X7!(æœ)'At)A*t = %. 
Alors l’expression à transformer devient 
A* — A‘æy = A'(E - a‘). 
Ensuite, 

Z;/A*‘(E- ay) +2Z,(%)= 

YVAA*E-ay)+qay=VEË-ay)+vay =". 


On a ainsi vérifié que XA,X = X et achevé la démonstration. 

On peut utiliser les propositions 2 et 3 pour construire la matrice 
pseudo-inverse de la matrice donnée À. On considère pour cela 7 matrices 
À ,, .…, À,, Où la matrice À, (ft = 1, …,n) est composée de / premières 
colonnes de la matrice À. Vu que la matrice 4, comprend une seule 
colonne, A; s’obtient sans difficulté. Ensuite, on calcule successivement 
Aj,Aÿ,.…, jusqu’à ce qu’on n’obtienne 4; = A4*. 

Ce procédé est particulièrement commode si les données se complètent 
dans le temps et que l’on doive répéter pour la matrice À,,, les calculs 
accomplis auparavant pour la matrice À, si À,,, se deduit de À, par 
l’adjonction d’une colonne. Si l’on joint des lignes, la même méthode est 
utilisée pour la matrice transposée. 

Il faut noter qu’en utilisant la méthode étudiée, on est toujours obligé 
de déterminer le rang de la matrice si on procède à la pseudo-inversion. Les 
difficultés qui y sont liées apparaissent juste au moment où l’on doit établir 
si l'égalité 4AA *æ = «& est vérifiée ou non et, en conséquence, choisir la 
formule nécessaire. 

Il existe d’autres résultats ayant rapport aux liens entre la pseudo- 
inversion et la décomposition en blocs de la matrice, mais ils sont encore 
plus rebarbatifs (voir Albert [1]). 
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S 4. Méthode des moindres carrés 


1. Problème d’approximation de là fonction. Ce paragraphe est consa- 
cré aux applications des résultats obtenus auparavant sur les pseudo- 
solutions et les matrices pseudo-inverses. 

Les systèmes contenant un grand nombre d’équations linéaires et un 
relativement faible nombre d’inconnues apparaissent dans le problème sui- 
vant d’une grande importance pratique dont un cas particulier a été envi- 
sagé dans l’introduction au $ 1. 

Supposons qu’on effectue une suite d’épreuves pour étudier la dépen- 
dance entre deux variables £ et n, et que les résultats se présentent sous 
forme de m couples de valeurs 


(E!,n!),.…., (E7,n7). (1) 


Il faut trouver une fonction n = f(£) qui représenterait le mieux la dépen- 
dance réelle entre les variables. La fonction j est recherchée sous la forme 
d’une combinaison linéaire de fonctions données a priori 


PE) .…., P,(E), (2) 


appelées fonctions de base. 

On choisit ces fonctions suivant la nature du problème étudié. C’est 
ainsi que si l’on est fondé à supposer que la dépendance étudiée est périodi- 
que avec une période connue, on peut choisir pour fonctions de base les 
fonctions trigonométriques. Dans ce cas, la combinaison linéaire recher- 
chée apparaît sous forme de somme partielle de la série de Fourier. On uti- 
lise souvent comme fonctions de base les fonctions puissances (£ )* (k = 
= 0,...,n — 1)et d’autres polynômes. Avec un tel choix, la fonction f sera 
un polynôme. 

Les données expérimentales (1) contiennent des erreurs de mesure et, 
suivant la position du problème, d’autres erreurs aléatoires possibles. Aussi 
n’est-il pas exigé que toutes les égalités 


n'=f(#t"), i=1,...,m, (3) 


soient vérifiées, c’est-à-dire que la courbe représentative de la fonction f 
passe par tous les points (1) du plan de coordonnées. Il n’est exigé que la 
courbe passe, en un certain sens, le plus près possible de tous ces points. On 
exige en général que la somme des carrés 


Cm SEE + + (7 — SEM) (4) 


soit minimale. Si la fonction f est choisie de cette manière, on dit qu’elle est 
choisie d’après la méthode des moindres carrés. 

Soulignons la différence entre la position considérée du problème et le 
problème d’interpolation. Dans ce dernier, on recherche une fonction de 
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forme déterminée qui prend des valeurs données aux points indiqués. Dans 
le cas étudié, on suppose que les couples de nombres ne correspondent 
qu’approximativement à la dépendance réelle et on recherche une fonction 
de forme donnée qui correspond le mieux aux données expérimentales. 
Ceci étant, on ne s’attend pas à ce que la fonction obtenue représente exac- 
tement la dépendance réelle entre les variables, elle ne doit qu’approximer 
cette dépendance. En conséquence, dans un problème d’interpolation bien 
posé, le nombre de points est exactement égal au nombre de fonctions de 
base, tandis que dans la méthode des moindres carrés le nombre de points 
est en général beaucoup plus grand. 
Si f est une combinaison linéaire des fonctions de base 


SE) = 0" pi(E) + … + 0" p,(E), 


les égalités (3) représentent un système d'équations linéaires en 0:07: 
a,0! +... +a,0"= 1! 


0e (S) 


dont les coefficients sont les valeurs des fonctions de base aux points £!, 
…, £7, c’est-à-dire a; = w; (£'). Désignons la matrice du système par la 
lettre À. 

L'écart défini pour un ensemble donné de coefficients 8!, …, 8" substi- 
tués dans le système possède les composantes 


n' — f(£"), ..., n” — (ET), 


le carré de sa norme ayant la forme (4). Par conséquent, tout ensemble de 
coefficients minimisant la somme des carrées (4) vérifie le système normal 
associé au système (5). 

Il est toutefois important de souligner que, par rapport à la dépendance 
réelle entre les variables qu’on étudie, la solution du système normal n’est 
qu’une approximation des vraies valeurs des paramètres, ou comme on dit, 
n’est que leur estimation. 

Si les colonnes de la matrice À du système (5) sont linéairement indé- 
pendantes, le système normal possède une solution unique qui constitue la 
pseudo-solution du système (5). En conséquence, le problème posé a égale- 
ment une solution unique. 

Voyons dans quelle mesure on peut s’attendre à l’indépendance linéaire 
des colonnes de la matrice. Puisqu’on choisit les fonctions de base de la 
façon qu’il nous faut, il est donc naturel d'exiger qu’elles soient linéaire- 
ment indépendantes. Rappelons que les fonctions w,(£), .…, w,(£) sont 
dites linéairement dépendantes sur l’intervalle donne s’il existe une combi- 
naison linéaire non triviale à coefficients constants de ces fonctions, qui est 
32—6442 
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identiquement égale à zéro sur cet intervalle. Si les fonctions de base sont 
linéairement dépendantes sur l’intervalle comprenant tous les points £!, 
…, &”, il en résulte évidemment l’indépendance linéaire des colonnes de la 
matrice. Dans ce cas, le choix de la pseudo-solution normale du système (S) 
pour coefficients 8!, …, 4" ne sera qu’un des possibles. 

On voit facilement que l’indépendance linéaire des fonctions de base ne 
garantit pas l’indépendance linéaire des colonnes de la matrice. Par exem- 
ple, la matrice composée des valeurs des fonctions w,(£} = let w,(£) = 
= (£)? aux pointst! = let£? = —-]est 

{4 
LE 
Mais si les fonctions de base sont linéairement indépendantes, la stricte 
dépendance linéaire entre les colonnes est un phénomène exceptionnel dans 
les conditions de la représentation approchée des nombres. Les colonnes de 
la matrice peuvent devenir voisines des colonnes linéairement dépendantes 
et la matrice À proche de la matrice de rang inférieur. Dans ce cas, comme 
on l’a vu, la pseudo-solution normale varie fortement pour de faibles 
modifications des données initiales. 

C’est pourquoi, dans tous les cas, les calculs doivent être menés de 
manière à dévoiler l’instabilité numérique ou la non-unicité de la solution 
quand ces dernières ont lieu. Cela peut être fait de façon commode si en 
recherchant la pseudo-solution on se sert de la décomposition singulière de 
la matrice du système. On peut, comme il a été décrit au point 9 du $ 3, 
introduire une frontière € dépendant de la précision des calculs effectués et 
négliger les nombres singuliers de la matrice qui sont inférieurs à €. 

Estimons l’accroissement de la somme des carrés (4) engendré par l’éli- 
mination des nombres singuliers inférieurs à €. Il est d’abord évident que 
toute solution B!, …, B" du système homogène normal '4AB = 0 peut être 
ajoutée aux coefficients 8!, …, 8" sans que la somme (4) soit modifiée (voir 
proposition 2, $ 1). 

Les solutions d’un système homogène normal constituent dans l’espace 
des matrices-colonnes à r éléments un sous-espace qu’on a désigné par la 
lettre.# (il coïncide avec l’ensemble des solutions du système 48 = 0). En 
remplaçant par des zéros les nombres singuliers inférieurs à €, on joint en 
fait à ce sous-espace les matrices-colonnes #; pour lesquelles 


‘A AB; = a?B;, a; <E, (6) 
et on peut considérer que à = K, …,r. 


PROPOSITION 1. Si à la solution ® du système normal on ajoute une com- 
binaison linéaire quelconquey = y,8, + … + y,8,des matrices-colonnes 
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B; satisfaisant aux conditions (6), la somme des carrés (4) correspondant à 
la solution @ s'accroît au plus de e?lyl2. 


DÉMONSTRATION. La somme des carrés qu’on doit estimer est le carré de 
la norme de l’écart défini par la matrice-colonne # + +, c’est-à-dire 


lg — 4@ + y) = '[(y — 40) — Ay]f(® — 40) — Ay]. 
En chassant les parenthèses, on a 
lg — 4(0 + y)? = Ie — 4012 + 2(Y% 440 — 'Az) + 1Ayl2. 


En tenant compte de ce que @ est la solution du système normal, on obtient 
que la somme des carrés s’accroît de 412. Majorons cette grandeur. 
Selon les relations (6), on a 


LAy 2 = % 447 = % (y CA)AB, + … + y, (A) AB,) = 
= YyraiBx + … + vaiB,) < E (y y B4 + … + v,B,) = e*lyh?. 


La proposition est démontrée. 

La possibilité, fournie par la proposition 1, d’estimer simplement 
l’accroissement de la somme des carrés est un avantage important de la 
méthode permettant de trouver la pseudo-solution à l’aide de la décompo- 
sition singulière. 

2. Régression linéaire. Le problème envisagé plus haut de l’estimation 
des paramètres de la fonction f d’après ses valeurs approchées est un cas 
particulier du problème plus général étudié en statistique mathématique. 
Soit y une variable aléatoire*). Supposons que son espérance mathémati- 
que E(>) dépend linéairement de n variables a,, .., a, : 


EG) =0!a, +. +0"a,, (7) 


où les coefficients 0’ doivent être estimés sur le vu des valeurs observées de 


y. 
Les variables a; prennent m ensembles de valeurs qui forment une 
matrice À à m1 lignes et nr colonnes : 


l 
a;, ... a,» 


etes (8) 


a;', .. ar. 


Les valeurs a; sont considérées dans ce cas comme parfaitement connues. 
On dit que la matrice À est une matrice de régression et que les variables 
a; des régresseurs. Les régresseurs peuvent être des fonctions d’une seule ou 
eV 
*) Avant d'aborder ce point, il est nécessaire de connaître les cléments de théorie/i LPO 
babilités, par exemple, d'après le livre de Rozanov [33]. LÉ, Te « 


CE 
VA 
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de plusieurs variables ; on peut aussi considérer que tous les a; sont des 
variables indépendantes. 

On n’exigera pas que les colonnes de la matrice de régression soient 
linéairement indépendantes. 

A chaque ensemble de valeurs (8) correspond une valeur de la variable 
aléatoire y. Notons ces valeurs n!, .…, n°" et écrivons 


= al0! +... +al0" +e!, 


S 
| 


ou sous forme matricielle 
9 = A0 + £. (9) 


Selon (7), les variables aléatoires £' ont une espérance mathématique nulle. 
On les appelle erreurs, même si en réalité elles peuvent représenter des 
écarts naturels des valeurs de y par rapport à son espérance mathématique, 
écarts qui ne sont pas obligatoirement dus à des erreurs de mesure sur y. 

Si e’ sont des erreurs de mesure, il est naturel de supposer qu’elles ne 
sont pas corrélées entre elles et possèdent les mêmes variances, ce que nous 
admettrons dans la suite pour simplifier l’exposé. 

S'agissant du système d'équations linéaires = 40, la matrice-colonne 
£ est l’écart défini par la matrice-ligne® = 118!, ...,9"1 des valeurs exactes 
du paramètre. : 

La pseudo-solution ® de ce système est appelée estimation de ® obtenue 
par la méthode des moindres carrés. Elle vaut 


Ô = Az. (10) 


Les estimations qui, telles que ô, s’expriment linéairement par # 
s’appellent estimations linéaires. 

L’estimation qui dépend d’un ensemble des variables aléatoires # est 
naturellement une variable aléatoire. L’estimation est dite sans biais ou 
non biaisée si son espérance mathématique est confondue avec l’ensemble 
des vraies valeurs du paramètre #. 


PROPOSITION 2. Si les colonnes de la matrice de régression sont linéaire- 
L] y» L] L 1 pas L 1 
ment indépendantes, l'estimation ® obtenue par la méthode des moindres 
carrés est non biaisée. 


En effet, il découle des propriétés élémentaires de l’espérance mathéma- 
tique que 


E(@) = A*E(n) = A* 40, (11) 
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ce qui est équivalent à l’égalité exigée 

EO)=0, 
puisque les colonnes de la matrice À sont linéairement indépendantes par 
hypothèse. 

Dans le cas général, la formule (11) ne permet d’affirmer l’absence de 
biais que pour quelques projections def . Plus exactement, la matrice 4 * À 
est idempotente, c’est-à-dire que (4 * 4)? = 4*A et, par suite, on déduit 
de (11) que : 

E(A*48) = A*40. 


Selon la proposition 11 du $ 1, 4 * AÔ est la projection orthogonale de Ô 
sur le sous-espace .Z de #,. Ce sous-espace est composé des matrices- 
colonnes de la forme ‘Av pour v quelconque. Donc sip ef, on a À * Ap = 
= p et'bA* A = ‘p. Par conséquent, pour tous lesp ef on a 
E(pô) = pe, 

ce qui entraîne la 

PROPOSITION 3. Si les coefficients p appartiennent à .S, c’est-à-dire si 
bA* A = tp, alors ‘p@ est une estimation non biaisée de ‘p8. 


Les fonctions linéaires sur #,,, considéré comme l’ensemble de toutes 
les valeurs des paramètres, sont appelées fonctions paramétriques. La pro- 
position 3 se rapporte en fait à l’estimation de la valeur d’une fonction 
paramétrique ‘# sur l’ensemble des vraies valeurs du paramètre #. 

On a appelé plus haut estimation linéaire de la matrice-ligne des vraies 
valeurs du paramètre l’estimation qui dépend linéairement de #, c’est-à- 
dire une fonction linéaire sur Z,,. Etudions les fonctions linéaires sur Æ,, 
qui sont des estimations linéaires non biaisées des fonctions paramétriques. 

Par définition, la fonction ‘uf, où f e Z,,, est engendrée par la fonction 
paramétrique # (#) = ‘p# si pour tous les # on a 


{v40 = ‘p#, (12) 
ce qui équivaut à 
(vA = D, 
ou 
(Av = D. (13) 


Ainsi, la fonction paramétrique engendre une fonction sur %,, si et seule- 
ment sip e S. Toutefois, cette condition n’implique pas en général que la 
fonction engendrée est unique. En effet, la solution générale du système 
d’équations (13) est 

= ('A)tp + (Eh — (A)* (Abe = ('A)*p + (E, — AA'}, 


où c est une matrice-colonne quelconque à m éléments (voir proposition 13, 


$ 1). 
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Supposons que f(T) = ‘uf est une fonction linéaire sur %,, engen- 
drée par une fonction paramétrique. Cherchons l’espérance mathématique 
et la variance de la valeur f sur la matrice-colonne # vérifiant (9). On 
admettra dans ce cas que les erreurs e/ ne sont pas corrélées et présentent les 
mêmes variances V(£') = a2. 

On a pour l’espérence mathématique 


E('n) = E('v48 + 'wæ) = 'v40 = ‘6. (14) 


Donc, E (‘ue ) est égale à la valeur de la fonction génératrice sur l’ensemble 
des vraies valeurs du paramètre. De ce point de vue, ‘w est une estimation 
non biaisée de ‘pô. En appliquant ce résultat, on trouve 


Vu) = Elu — ‘p8)? = El!v(n — 40))? = El'uwæ)’. 


Ensuite, utilisons l'égalité ‘uz = ‘zu se vérifiant pour toutes matrices- 
colonnes : 


E (‘uw )? = Elu(et )u) = 'vE(c'e)u = ‘vo’?E,,v = o°lul?. 
Ainsi donc, 
V(un) = o°lul!. (15) 


Il en découle en particulier, qu’après avoir choisi la solution du système 
(13) de norme minimale, on choisit parmi toutes les fonctions engendrées 
par la fonction paramétrique donnée celle pour laquelle la variance V (‘we ) 
est minimale. Le système (13) est supposé compatible. Il a une solution uni- 
que de norme minimale, à savoir la pseudo-solution 


Vo = (‘A ) D. 
La valeur de la fonction de matrice-ligne de coefficients ‘v, sur le vec- 
teur # est selon (10) égale à 


UAL = pA*'9 a (D, 


c’est-à-dire à la valeur de la fonction génératrice sur l’estimation® obtenue 
par la méthode des moindres carrés. Il s’ensuit le 


THÉORÈME 1. De toutes les estimations non biaisées de la forme ‘we 
d’une fonction paramétrique ‘p# l'estimation ‘v,æ = (DŸ de la méthode des 
moindres carrés a la plus petite variance. 


En particulier, si les colonnes de la matrice À sont linéairement indé- 
pendantes, on a. = Æ,,, et toutes les fonctions paramétriques admettent 
une estimation. Il en est de même des fonctions e#, oùe, sont les lignes de 
la matrice unité. Ces fonctions sont égales à 0, et leurs estimations non 
biaisées de variance minimale seront les composantes #/ obtenues par la 
méthode des moindres carrés. 
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Le théorème démontré indique pourquoi il faut minimiser la somme des 
carrés, c’est-à-dire utiliser la norme euclidienne et non pas, disons, la 
somme des modules. Il faut remarquer que les avantages de la méthode des 
moindres carrés ne se sont pas révélés aussitôt. Ainsi, Laplace exigeait 
d’abord une minimisation de Ÿ le'l. 


Soit £ un « vecteur aléatoire », c’est-à-dire une matrice-colonne compo- 
sée de m variables aléatoires £!, .…, £". Son espérance mathématique est 
une matrice-colonne a formée des éléments a’ = E(£'}). On appelle matrice 
de covariance de £ la matrice 


V(E) = EIŒ —a)'(& —-a)]. 


Ses éléments diagonaux sont les variances des £' correspondantes, tandis 
que les éléments non diagonaux, les covariances cov(£", £/). 

Voyons comment on peut estimer la matrice de covariance de l’estima- 
tion # obtenue par la méthode des moindres carrés si l’on suppose que . 
erreurs € ne sont pas corrélées et possèdent une même variance égale à a? 
Cela signifie que 


V(&)=0?E,,. 
De V(æ) = V(z — 40) = V(z)il résulte que 
V(#)=0°E,,. (16) 


Il n’est pas difficile de vérifier que pour tout vecteur aléatoire £ et toute 
matrice constante S il découle de £ = St’ que E(£) = SE(£’)et 


V(E) = SV(E”)('S). 
Il s’ensuit en vertu de (10) que 
VO = A*o?(E,.)'(A*) = o2(A*) (A*). 
Il n’est pas difficile de vérifier que (4 * )'(4*) = (‘44)*. Donc, 
VO = 52(‘4A)*. 
On appelle somme des carrés résiduelle la grandeur IËU? si£ = # — 


— A0. Cherchons l’espérance mathématique de la somme des carrés rési- 
duelle. On a 


ge = —- AA*#)@ —- AA*z) = q(E — 244* + (4*)'4AAA +} = 
= ((E — AA*}. 
Désignons les éléments de la matrice E — 4A4* par p;.. Alors 
a(E — AA*)}y = Yoÿn'n’, 


1J 
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et'££ peut être mis sous la forme 
y py(n'n/ — E(n')E(n)) + Y p;E(n')E(n/). (17) 
iJ iJ 
Calculons l’espérance mathématique de cette expression. Notons pour cela 
que selon la formule (16) 
.. | | .. 0, i+#j, 
E(ni ni — E(ni) Eln/)) = cov (ni, n/) = | Ne 
do“, =. 
Le premier terme dans l’expression (17) est donc 
o? y Dj — o?tr (E = AA ). 
i 


Le second terme est une constante, et son espérance mathématique est donc 
égale à ce terme. Ecrit sous forme matricielle, ce terme est égal à 


(E(#)XE — AA°)E(#), 

ou #'A(E — AA *)406. Or 

0 (‘AA — 'AAA*A)0 = 0. 
Ainsi donc, 

E(lel?) = o?tr (E — AA*). 
Pour trouver la trace de la matrice Æ — 44*, souvenons-nous que la 
matrice 4 A * est idempotente (voir p. 466). Il en est donc de même de E — 
— AA* et, par suite, ses nombres caractéristiques sont tous égaux à zéro 


ou à l’unité. Vu que Rg (E — 4AA4*) = m — r, il y a exactement m — r 
nombres caractéristiques égaux à l’unité. Donc, 


tr(E — AAf)=m-r. 
En définitive, on obtient 
EGlel?) = o2(m-r). 


Ce résultat est utilisé à la recherche de l’estimation du paramètre o suivant 


la formule 2 

- le “I 

o? _ . 
m-r 


L’étude analytique de la régression peut être approfondie d’après le 
livre de Seber [35] ou tout autre cours de statistique mathématique. Les 
applications des matrices pseudo-inverses aux problèmes de statistique sont 
décrites dans le livre d’Albert [1]. 


CHAPITRE XV 


SYSTÈMES D’INÉQUATIONS LINÉAIRES 
ET PROGRAMMATION LINÉAIRE 


$ 1. Systèmes d’inéquations linéaires homogènes 


1. Définitions fondamentales. Dans ce paragraphe, on étudiera les 
systèmes d’inéquations de la forme 


aix! +. + alx" > 0, 
TT (1) 


où ai sont des constantes réelles. Sans restreindre la généralité on peut 
poser que toutes les inéquations sont de même sens (20). En effet, on peut 
mettre l’inéquation a,x! + ... + a,x" < 0 sous la forme nécessaire en la 
multipliant par — 1. De même, il est possible d’écrire sous la forme (1) tout 
système mixte composé d’équations et d’inéquations linéaires homogénes, 
vu qu’une équation linéaire homogène peut être écrite sous la forme d’un 
couple d’inéquations a,x! + … + ax" > Oet —a,x! — … — a,x" > 
> 0. D'autre part, l’absence dans le système étudié d’inégalités strictes 
(avec le signe >) constitue une hypothèse importante. 

Convenons de poser que la matrice-colonne x est positive, et d’écrire 
x > 0 si tous les éléments de la matrice-colonne sont positifs. Une même 
convention peut être faite pour les inégalités x < 0,x > y,etc. Ceci étant, 
il faut avoir en vue que toutes les matrices-colonnes ne sont pas compara- 
bles, c’est-à-dire que les deux inégalités x > yet x < y peuvent ne pas être 
vraies. 

En utilisant les notations introduites, on peut écrire le système d’iné- 
quations (1) sous forme matricielle 


Ax > 0. (2) 
Considérons une interprétation géométrique du système d’inéquations 
(1) en termes d’espaces vectoriels. Soit _# un espace vectoriel réel rapporté 


à une base lle,, .., e, 1. L'ensemble des vecteurs dont les coordonnées véri- 
fient l’inéquation linéaire homogène 


a, x! +. +4a,x7 > 0 
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est appelé demi-espace fermé. Si l’inégalité est stricte, le demi-espace est dit 
ouvert. Le demi-espace fermé est la réunion d’un demi-espace ouvert et 
d’un sous-espace frontière défini par l’équation 


ax! + … + ax" = 0. 


On étudiera partout, sauf mention expresse du contraire, les demi- 
espaces fermés. 

L’intersection d’un nombre fini de demi-espaces est appelée cône polyé- 
drique convexe fermé. Vu que dans ce chapitre on ne rencontrera pas 
d’autres cônes, on laissera souvent tomber les qualificatifs « fermé », 
« convexe » et « polyédrique ». Selon cette définition, l’ensemble de tous 
les vecteurs dont les coordonnées vérifient le système d’inéquations linéai- 
res homogènes est un cône polyédrique convexe. 

Comme toutes les définitions où interviennent les coordonnées, les défi- 
nitions du demi-espace et du cône dépendent de la base. On vérifie facile- 
ment qu’en réalité cette dépendance n’existe pas : un ensemble défini par le 
système (2) dans une base se définit par un système de même type dans 
toute autre base. En effet, soitx = Sx’. Alors le système (2) est équivalent 
à ASx° > 0. 

En général, on n’aura pas besoin de procéder à des changements de 
base. La base étant fixée, on est en fait en présence d’un espace arithméti- 
que n-dimensionnel. On notera le vecteur de la même façon que sa colonne 
de coordonnées, et ses composantes par la même lettre affectée d’un indice. 

Donnons des exemples de cônes polyédriques dans l’espace tridimen- 
sionnel : 

1)x! > 0, x°>0, x? > 0 (octant positif) ; 

2) x! > 0, x? > 0 (dièdre) ; 

3)x! > 0, —x! > 0 (plan); 

4) xl >0, x22>0, x3>0, x! + x? — x3 > O (cône tétraédri- 
que) ; 

S)x! >0, x2>0, x3>0, x! +x2—- x3 > 0, —x! — x? + 
+ x3 > 0 (angle plan). 

Laissons au soin du lecteur de montrer que sont des cônes : le vecteur 
nul, un sous-espace unidimensionnel et une demi-droite, c’est-à-dire un 
ensemble de vecteurs de la forme ax, où x # 0 et x > 0. 


PROPOSITION 1. Si les vecteurs x, et x, appartiennent à un cône polyédri- 
que convexe .*#, il en est de même des vecteurs x, + x, et ax, pour tout 
a > (. 


On le démontre facilement par substitution des coordonnées des vec- 
teurs dans le système d’inéquations linéaires définissant le cône. 

Soit donné un cône .#. On peut envisager son enveloppe linéaire, c’est- 
à-dire l’ensemble de toutes les combinaisons linéaires finies des vecteurs 
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appartenant au cône. L’enveloppe linéaire est le sous-espace de dimension 
minimale contenant le cône .#: La dimension de l’enveloppe linéaire du 
cône est appelée dimension du cône. 

On dit que l’inéquation du système (1) représente une contrainte-égalité 
si pour toutes les solutions du système elle n’est vérifiée que comme une 
équation. En substituant les équations à de telles inéquations, on ne fera 
pas varier l’ensemble des solutions du système. 


PROPOSITION 2. Si p est le rang de la matrice composée des coefficients 
des contraintes-égalités, le cône .* défini par le système (1) est contenu 
dans un sous-espace (n — p)-dimensionnel et y est défini par le système ne 
renfermant pas de contraintes-égalités. 


DÉMONSTRATION. Sans restreindre la généralité on peut supposer que les 
p premières inéquations du système représentent des contraintes-égalités et 
que les matrices-lignes de coefficients qui leur correspondent sont linéaire- 
ment indépendantes. Admettons que ces matrices-lignes ont été complétées 
d’une façon quelconque jusqu’à une matrice carrée régulière S. Introdui- 
sons une nouvelle base liée à l’ancienne par la matrice de passage S-!. Le 
cône étudié s’écrira dans la nouvelle base par un système d’inéquations 
linéaires 

AS”!y > 0. (3) 

Ce système ne diffère de celui de départ que par la transformation des 
variables et, par suite, aux contraintes-égalités du système initial corres- 
pondent des contraintes-égalités, et aux contraintes-inégalités, des 
contraintes-inégalités. Les p premières lignes de la matrice AS - ! se confon- 
dent avec les lignes de la matrice unité. Aussi les p premières inéquations du 
système (3) sont-elles de la forme y! > 0, ., y? > 0. On peut les rempla- 
cer par les équations sans changer l’ensemble des solutions du système. 
Ceci étant, les autres contraintes-égalités sont satisfaites automatiquement. 
En tenant compte des égalités y! = 0,...,yP = 0 dans les inéquations res- 
tantes, on obtient un système d’inéquations en yP*!, .…., y”, qui est le 
système de contraintes-inégalités. 

On voit donc que le cône est contenu dans le sous-espace engendré par 
les n — p-derniers vecteurs de base et est défini dans ce sous-espace par le 
système de contraintes-inégalités. La proposition est donc démontrée. 


PROPOSITION 3. Si le système d'inéquations linéaires homogènes (1) ne 
contient pas de contraintes-égalités, le système correspondant d'inéqua- 
tions strictes 


Rd (4) 


possède une solution. 
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DÉMONSTRATION. D’après la définition de la contrainte-inégalité, il 
existe pour la i-ième inéquation, i = 1, .., m, une solution du système x, 
telle que l'inégalité stricte soit vérifiée. Considérons la matrice-colonne 
x, + … + x,,. Soit af la matrice-ligne de coefficients de la i-ième inéqua- 
tion du système. En substituant la matrice-colonne x, + ..… + x, dans 
cette inéquation, on obtient 


a'(x, +. +x,) = aix, + … + aix, + … + aix. 


Tous les termes sont ici positifs et le terme ax; est strictement positif. 
Ainsi, x, + … + x,, est la solution dont on démontre l'existence. 

Soit .# le cône défini par le système (1) ne contenant pas de contraintes- 
égalités. Les vecteurs dont les coordonnées vérifient le système (4) sont 
appelés vecteurs intérieurs au cône .#’et l’ensemble de tous les vecteurs inté- 
rieurs, son intérieur. En accord avec la proposition 2, tout cône dans un 
sous-espace est défini par un système de contraintes-inégalités. Le système 
correspondant d’inéquations strictes possède des solutions dans le sous- 
espace mentionné. L'ensemble de ces solutions est appelé intérieur relatif 
du cône. 


PROPOSITION 4. Chaque vecteur intérieur au cône .# est contenu dans ce 
cône avec l’un de ses voisinages par rapport à une norme quelconque. 


Vu que toutes les normes sont équivalentes (théorème 1, $ 3, ch. XI), il 
suffit de démontrer l’assertion pour la c-norme 


Ixt, = max lxil. 


î 


Considérons d’abord une seule inéquation et un vecteur x, pour lequel 
ax) +. +a,xÿ = h > 0. 


€ = h (£ CDR (5) 


(Le nombre € est bien défini, vu que tous les coefficients a,, .…, a, ne sont 
pas nuls : l’inéquation dont tous les coefficients sont nuls est une 
contrainte-égalité.) Si le vecteur x est tel que 1x — xl, < €, il vérifie aussi 
l’inéquation stricte. En effet, en désignant x} — x’ par ô', on obtient 


D a5!|. 
{= 


Posons 


n n ñn 
Dax = Yax,- Ya >h- 
im] i=] is] 


> A lô,lla,l < max | ô, | y la,l < h. 


=] 1] 


) a.ôi 
is] 
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D’où on conclut que , 
ÿ ax! > 0. 
is] 

Considérons maintenant le système d’inéquations (4) et le vecteur x, qui 
est la solution de ce système. Chacune des inéquations du système définit, 
d’après la formule (5), le rayon d’un voisinage du vecteur x,, dont tout vec- 
teur vérifie cette inéquation. Le plus petit de ces voisinages est composé de 
vecteurs vérifiant le système (4). 

Il est maintenant aisé de démontrer la 


PROPOSITION 5. Si le cône .*# dans l'espace Z est défini par le système 
d'inéquations linéaires sans contraintes-égalités, la dimension de # vaut la 
dimension de l'espace #. 


Pour démontrer cette proposition, considérons un vecteur intérieur 
quelconque x, du cône .#. Supposons que ses coordonnées sont x}, .., xf, 
et € est le rayon d’un voisinage du vecteur x, composé de vecteurs intérieurs 
à #. Considérons les vecteurs de coordonnées 


x} — M xé, , X6» 
xs x£ — M » X6» 
x®, x ., X5 — 1, 


où Înl < € et n est différent des nombres caractéristiques de la matrice 
dont toutes les lignes coïncident avec la ligne Ix!, .., x71. On voit aisé- 
ment que ces vecteurs sont linéairement indépendants et appartiennent à 
Æ. La proposition est démontrée. 

Il ressort de ce qui précède la 


PROPOSITION 6. La dimension du cône .# défini par le système d’inéqua- 
tions linéaires (1) vaut n — p, où p est le rang de la matrice composée des 
coefficients de toutes les contraintes-égalités du système. 


2. Structure du cône polyédrique convexe. Soit .# le cône défini par le 
système d’inéquations (1). Considérons un sous-ensemble du cône 
obtenu par substitution de certaines contraintes-inégalités du système (1) 
par des équations correspondantes. On voit aussitôt que ce sous-ensemble 
de .# est un cône de dimension inférieure. On l’appelle face du cône .#: 

Un cas particulier de face est le sous-espace défini par le système 
d’équations linéaires 


TT (6) 
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Cette face porte le nom de face minimale du cône. Cette appellation est liée 
au fait que toute face .# ” renferme la face minimale. La dimension de la 
face minimale est 7 — r, où r est le rang de la matrice À composée des 
coefficients du système (1). 

En considérant la face .# ” du cône .# comme un nouveau cône, on est 
en mesure de définir les faces de .# ‘. Il s’avère qu’elles sont des faces du 
cône .Ÿ. La face minimale du cône .# est encore la face minimale de l’une 
quelconque de ses faces. 

La face minimale du cône peut s’avérer le sous-espace nul. Dans ce cas, 
le cône est dit pointé. Pour qu’un cône soit pointé il faut et il suffit que 
Re À = n. Si Re À < n, le cône est dit épointé. 

Introduisons la définition suivante. Soient P …, # des ensembles de 
vecteurs de l’espace vectoriel Æ#. On appellera somme ? +. + # de 
ces ensembles l’ensemble de tous les vecteurs de la forme x = x, + … 

+ x, où x.Ee P,i = 1,...,q. 

Notons que la somme usuelle des sous-espaces est leur somme au sens 
indiqué plus haut. 

Maintenant on peut formuler et démontrer la proposition qui suit. 


PROPOSITION 7. Tout cône polyédrique convexe .# est la somme d’un 
cône pointé # | et de sa face minimale 9. Chaque face #° du cône #est 
la somme de 9 et d’une face du cône # \. Inversement, chacune de ces 
sommes est une face du cône #. 


DÉMONSTRATION. Soit 1 un sous-espace tel que # = 0 + Il et 
9 N Z1 = 0. Considérons l’ensemble de vecteurs #1 = 71 NM #. Il 
est défini par le système d’inéquations obtenu par réunion du système 
d’inéquations (1) du cône .# et du système d’équations du sous-espace !. 
Donc, #! est un cône. La face minimale de .#! est définie par le système 
d’équations obtenu par substitution des équations à toutes les inéquations 
du système (1) et par adjonction des équations du sous-espace Z!. Or 
c’est le système d’équations de /® MN 71 qui ne possède que la solution 
triviale. Donc, le cône .# ! est pointé. 

Ensuite, pour tout xe Æ# on a la décomposition x = x, + x,, où 
x Eetx,e |. Sixe.#, le vecteur x, qui est la somme des vecteurs x 
et —x, de .#appartient aussi à #: Ainsi, x, e # !. Inversement, si x, € 4 
etx,e Ÿl,onax, + x, e .#. Ceci achève la démonstration de la première 
assertion. 

Pour démontrer la seconde assertion, il suffit de remarquer que l’inter- 
section # ’ N /! est une face du cône .# !. Or ce fait est évident parce 
que le système d’inéquations de .#’ MN _Z! se déduit du système de 
H\ = SN 1 par substitution d'équations à quelques inéquations, plus 
précisement à celles qui deviennent équations sur la face .#” du cône .# 

L’assertion inverse se démontre de façon aussi bien simple. 
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Une conclusion importante sur la structure des cônes polyédriques peut 
être tirée de la proposition suivante. 


PROPOSITION 8. Soit .# un cône polyédrique convexe pointé de dimen- 
sion > 2. Chaque vecteur x, € .# peut être représenté comme une somme de 
deux vecteurs appartenant aux faces de X. 


DÉMONSTRATION. Pour le vecteur appartenant à une face l’assertion est 
évidente. Soit x, un vecteur n’appartenant à aucune face. 

Désignons par a!, .…, a” les lignes de la matrice du système d’inéqua- 
tions définissant .#’et considérons un vecteur x, de .#’non colinéaire au 
vecteur x,. On supposera qu’aux contraintes-inégalités sont associés les 
numéros { < s. On a alors pour ces i les inégalités strictes a'x, > 0. 

Considérons les nombres 
a'x, 


0 


î 


et démontrons que parmi ces derniers deux au moins sont différents. En 
effet, s’il existe un nombre À tel que pour tous les i < s 


X(a'x,) — aïx, = 0, 


le vecteur Àx, — x, vérifie toutes les contraintes-inégalités en tant que 
racine des équations correspondantes. En outre, pour tous les ; > s,on a 
aix, = Oeta'x, = 0. Il s’ensuit que Àx, — x, vérifie également toutes les 
contraintes-égalités. Cela signifie que Àx, — x, appartient à la face mini- 
male du cône .#’et, par suite, est nul car le cône est pointé. Dans ce cas, le 
vecteur x, est colinéaire à x,, ce qui contredit l'hypothèse. 

Ainsi donc, parmi les nombres X, il existe un maximal à, et un minimal 
À... Pour À,,on a 


N(aïx,) — (ax,)2>0, i+li<s, 
À,(a!x,) — (a!x,) = 0. 
De plus, 
ÀX,(a'x,) — (ax) =0, i>s, 


vu que x, et x, vérifient les contraintes-égalités. Toutes ces relations signi- 
fient que le vecteur y = À,x, — x, appartient à une face du cône .#: On 
démontre de façon analogue que le vecteur z = x, — XX appartient à une 
autre face du cône .#: Maintenant l’assertion nécessaire découle facilement 
de l'égalité y + z = (À, — À,)X- 

Les faces d’un cône polyédrique convexe possèdent la propriété suïi- 
vante. 


PROPOSITION 9. Si le vecteur x de la face .# ” est une somme de plusieurs 
vecteurs du cône, tous ces vecteurs appartiennent à # ‘. 
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En effet, soit a’ la matrice-ligne des coefficients d’une des inéquations 


du système, qui deviennent équations sur la face .#”’, et soit 
x = x, + .… + x, la décomposition dont il s’agit. Alors, 


aix = aix, + + aix, = (. 


Or la somme de nombres positifs ne s’annule que si tous ces nombres sont 
égaux à zéro. Donc ax. = 0 pour tous les ÿj = 1, .…., /, d’où la proposition. 
On obtient les faces unidimensionnelles d’un cône par substitution des 
équations à #7 — 1 inéquations linéairement indépendantes du système 
définissant le cône. S'il reste encore une contrainte-inégalité indépendante, 
la face unidimensionnelle est une demi-droite. Les faces unidimensionnel- 
les sont appelées arêtes du cône polyédrique. Dans un cône pointe, la face 
unidimensionnelle est obligatoirement une demi-droite. 


PROPOSITION 10. Un cône pointé est la somme de ses arêtes. 


Démontrons d’abord que chaque vecteur x d’un cône pointé peut être 
représenté sous la forme 


X = @,x, se ANXN 


où tous les a. > 0, et x; sont des vecteurs non nuls appartenant aux arêtes 
du cône. 

La démonstration sera donnée par récurrence sur la dimension du cône. 
Dans un cône pointé bidimensionnel, les arêtes constituent des faces et, par 
suite, la démonstration de la proposition 10 coïncide avec celle de la propo- 
sition 8. 

Pour un cône de dimension ñ#, chaque vecteur x peut, en vertu de la 
même proposition 8, être décomposé en somme x = x, + x,, où x, et x, 
appartiennent aux faces. Les faces sont des cônes pointés de dimension <n 
et selon l’hypothèse de récurrence on a les décompositions 


X, = a}, + ... + AxYk 


et 
X., = B, 2; + ... + By 2» 


où tous les @,, B; > 0,etpet z; sont des vecteurs non nuls appartenant aux 
arêtes. D’où on obtient la proposition nécessaire. 

L’assertion inverse est évidente. En effet, si x,, .…, x, sont les vecteurs 
directeurs des arêtes, toute combinaison linéaire positive de ces vecteurs 
appartient au cône selon la proposition 1. 

Pour passer des cônes pointés aux cônes de forme générale, démontrons 
la 


PROPOSITION 11. Le sous-espace /, de dimension q est la somme de 
q + 1 demi-droites. 
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DÉMONSTRATION. Soit Ve, …, el une base dans ©. Posons 
Je e(e, Fa e, ). Alors pour tout i= À, nana vec 
—e, = f + D e;. 


Jai 


Un vecteur quelconque x de 4 admet la décomposition x = £le, + 
. + £9e . Si £' < O0 pour un i quelconque, remplaçons £'e, dans la 
décomposition de x par 


lE’] ( +je ) 
Jét 
Après la réduction des termes semblables on obtient la décomposition de x 
suivant les vecteurs e,, …, e,, f à coefficients positifs. 
Inversement, on voit aussitôt que toute combinaison linéaire de ces vec- 
teurs à coefficients positifs appartient à Lq . La proposition est démontrée. 
Les propositions 7, 10 et 11 permettent d’énoncer le théorème suivant. 


THÉORÈME 1. Tout cône polyédrique convexe fermé est la somme d’un 
nombre fini de demi-droites ou, ce qui revient au même, l'ensemble des 
combinaisons linéaires d’un nombre fini de vecteurs à coefficients positifs. 


Il se peut que pour certains objectifs la représentation se rattachant à la 
proposition 7 soit plus commode : tout vecteur du cône est la somme d’une 
combinaison linéaire de vecteurs de base de la face minimale et d’une com- 
binaison linéaire positive de vecteurs non nuls appartenant aux arêtes d’un 
cône pointé. 

Le théorème 1 peut être formulé de façon différente : 


THÉORÈME la. La solution générale d’un système d'inéquations linéaires 
homogènes peut être écrite sous la forme 


X = ax, + .. + AN XN 


où x;,, .…, x est un ensemble de solutions et les coefficients &,, …, æ, sont 
positifs. 


On se servira de la terminologie suivante. L’ensemble fini de demi- 
droites dont la somme est un cône, sera appelé système de génératrices du 
cône et l’on dira qu’elles engendrent le cône. Quant aux vecteurs directeurs 
de ces demi-droites, on dira également qu’ils engendrent le cône. 

On appelle carcasse du cône le système minimal (en quantité) de ses 
génératrices. Par abus de langage, on appellera aussi carcasse l’ensemble 
des vecteurs directeurs des demi-droites formant la carcasse du cône. 

S'agissant du système d’inéquations linéaires, on dira que l’ensemble 
des solutions mentionné dans le théorème la est une famille complète de 
33—6442 
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solutions. On appellera famille fondamentale \a plus petite (en quantité) 
famille complète de solutions. 

Notons qu’il existe un procédé laborieux qui permet en principe d’obte- 
nir toutes les arêtes du cône pointé : il suffit de passer en revue tous les 
sous-systèmes de rang 7 — ] du système d’équations linéaires (6). (Ces 
systèmes existent car le rang du système (6) vaut n et l’élimination d’une 
équation diminue le rang au plus de 1.) Chacun de ces systèmes possède une 
famille fondamentale de solutions formée d’une solution unique. Si cette 
solution x vérifie le système (1), elle définit l’arête du cône ; si x vérifie le 
système (1) de signes contraires (<), c’est —x qui définit l’arête du cône. 
Dans les autres cas, x ne présente pas d’intérêt. 

En parlant des familles fondamentales de solutions des systèmes d’iné- 
quations linéaires homogènes, il faut avoir en vue qu’elles diffèrent essen- 
tiellement des familles fondamentales de solutions des systèmes d’équa- 
tions homogènes. Plus précisément, la décomposition de la solution du 
système d’inéquations suivant la famille fondamentale de solutions n’est en 
général pas unique. Donnons un exemple correspondant. 

Supposons que le cône tétraedrique est défini dans un espace tridimen- 
sionnel par le système d’inéquations 


x! >0,, x?>0, x>0, x! +x-xi > 0. 


On voit aussitôt que la carcasse de ce cône peut, par exemple, être compo- 
sée des vecteurs e,, e,, f = e, + e,etg = e, +e,,oùe,,e, ete, sont les 
vecteurs de base. On remarque de même aisément que le vecteur e, + f 
appartenant au cône peut aussi être représenté sous la forme e, + g. 

Pour décrire la carcasse d’un cône quelconque, introduisons la défini- 
tion suivante. On appelle vecteur extrémal du cône .# un vecteur x e .# qui 
n’admet aucune représentation de forme x, + x,, où x; et x, sont des vec- 
teurs non colinéaires appartenant à .# Autrement dit, le vecteur x est extré- 
mal si de x = x, + x, et x,, x, e .#’il ressort que x, et x, sont colinéaires. 

Il est évident que le vecteur Àx proportionnel au vecteur extrémal x 
pour un À positif est aussi extrémal. La demi-droite composée de vecteurs 
extrémaux est dite extrémale. 


PROPOSITION 12. Si le cône .# est pointé, ses arêtes sont ses seules demi- 
droites extrémales. 


En effet, si le vecteur x € .# n’appartient pas à l’arête de .# il appar- 
tient soit à l’intérieur de _#, soit à l’intérieur de sa face de dimension > 2. 
Dans ce cas, il n’est plus extrémal car se décompose en somme de deux vec- 
teurs appartenant aux faces du cône auquel il est intérieur. Ainsi, seules les 
arêtes peuvent être des demi-droites extrémales. Or elles sont justement des 
demi-droites extrémales, ce qui découle de la proposition 9. La proposition 
est démontrée. 
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Chaque demi-droite extrémale du cône est contenue obligatoirement 
dans sa carcasse, car les vecteurs de cette demi-droite ne sont pas des com- 
binaisons linéaires positives de vecteurs d’autres demi-droites. On peut 
donc enoncer le corollaire immédiat des propositions 10 et 12. 


PROPOSITION 13. La carcasse d'un cône pointé ne contient que ses arêtes. 
Démontrons maintenant la proposition qui suit. 


PROPOSITION 14. La carcasse d’un cône .“ est la réunion des carcasses de 
sa face minimale: et du cône pointé .# tel que # = 4 + X#. 


DÉMONSTRATION. Selon la proposition 7, le cône .# possède des faces de 
dimension # — r + 1 dont chacune est la somme de la face minimale 4 
du cône .#’et d’une des arêtes du cône .#;. Soit .Æ#une de ces faces. On 
obtient la carcasse de .#si à la carcasse de # on joint le vecteur directeur 
de l’arête du cône .#, qui est contenue dans .#. En effet, il va de soi que 
tous les vecteurs de .# se décomposent en des combinaisons linéaires posi- 
tives de ce système de nr — r + 2 vecteurs. La carcasse de .# ne peut 
posséder un nombre inférieur de vecteurs, car l’ensemble des combi- 
naisons linéaires positives de n — r + 1 vecteurs est dans l’espace 
(n — r + 1)-dimensionnel soit un cône pointé (si ces vecteurs constituent 
une base), soit un cône de moindre dimension (si les vecteurs sont linéaire- 
ment dépendants). 

. Ensuite, en vertu de la proposition 9, la carcasse du cône .#’ doit conte- 
nir les carcasses de toutes ses faces (#7 — r + 1)-dimensionnelles. Le 
système minimal répondant à cette exigence est le système de vecteurs dont 
il s’agit dans l’énoncé de la proposition, ce qui achève la démonstration. 

La proposition démontrée peut être considérée comme une précision du 
théorème 1, permettant de décrire le système minimal de vecteurs qui 
engendre le cône. 

On démontrera plus bas le théorème inverse du théorème 1, mais avant 
il nous faut étudier les inéquations linéaires qui se déduisent du système 
donné d’inéquations linéaires. 

3. Inéquations résultant d’un système d’inéquations linéaires. Considé- 
rons une combinaison linéaire positive des inéquations du système (1). 
Cette inéquation linéaire est de la même forme que les inéquations du 
système. La matrice-ligne de ses coefficients est #4, où u est la matrice- 
ligne Uu,, .…, u, Î d'éléments positifs et À la matrice du système. 

Il est évident que l’inéquation u Ax > 0 est une conséquence du système 
Ax > 0 au sens qu’elle se vérifie pour toutes ses solutions. 

On obtiendra ici le résultat fondamental consistant dans le fait que cha- 
que inéquation linéaire homogène se déduisant du système Ax > Dest de la 
forme uAx > 0 pour u > 0. Ce résultat est connu sous le nom de fhéo- 
rème de Farkas. Démontrons préalablement la 
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PROPOSITION 15. Les systèmes Ax > Oet uA = 0,u > 0 possèdent les 
solutions x, et u, pour lesquelles 


AX, + ‘Up > (. (7) 


Démontrons d’abord qu'il existe des solutions pour lesquelles la pre- 
mière composante du premier membre de (7) est strictement positive. Après 
quoi la démonstration se fera sans difficulte. 

Si m = 1, c'est-à-dire si la matrice À est composée d’une seule ligne, 
l’assertion est évidente. En effet, si l’unique ligne a! est nulle, posons 
x = Oetu = 1. Dans le cas contraire, posons x = ‘(a!)et u = 0. 

Admettons maintenant que l’assertion est démontrée pour les matrices 
composées de m — 1 lignes et démontrons-la pour une matrice À à m 
lignes a!, …, a”. Les lignes a!, .….,a”-! constituent la matrice À à laquelle 
on peut appliquer l’hypothèse de récurrence. Il existe donc une matrice- 
colonne x à n éléments et une matrice-ligne positive Hu!, .…,u"-11] pour 
lesquelles 


Ax>0, uÂ=0, ax +u!>o. 
Si a”x 2 0, alors xet Hu!, ...,u”-1, OÙ sont les solutions cherchées, 


et l’assertion est démontrée. Admettons que a” x < 0. 
Composons la matrice B de type (m — 1, n) à partir des lignes 


b' = ga! — a'a”, i= 1,...,m — 1, 


où 


Il est évident que la matrice-colonne Bx est composée des éléments 
aix + œ'a”"xet, par suite, est nulle. Appliquons à la matrice B l’hypothèse 
de récurrence. On obtient la matrice-colonne y et la matrice-ligne vw telles 
que 
B»>0, vB=0, v2>0, 
b'y + vu! > O0. 


Considérons la matrice-ligne 
m— | 
w = ul, ...,u"-l, — ) avt. 
te] 


Elle est positive car tous les v' > 0, a, < 0 en vertu de a'x >0et 
a"x < 0. On voit aussitôt que 
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Considérons la matrice-colonne z = y + Bx, où B est choisi de 
manière que a” z = 0. Il faut pour cela que 8 = —a”y/a"x. On a 


Az Bz By 
SE 0 0 @) 


On a utilisé ici l’égalité Bx = 0 démontrée plus haut. 

Ensuite, il résulte de (8) que a!z = b!'y. En outre, w! = v!. Donc, 
az + w! = bly + vl > Oet, par suite, z et w sont la matrice-colonne et 
la matrice-ligne cherchées pour la matrice À. 

Démontrons maintenant qu’il est possible de trouver une matrice- 
colonne x, et une matrice-ligne u, telles que Ax, > 0,u, A = 0,u, > 0et 
Ax + ‘u, > 0. Pour cela appliquons l’assertion démontrée plus haut à la 
matrice P.4, où P. est la matrice de permutation qui met la i-iêéme ligne à la 
première place. On obtient la matrice-ligne w, et la matrice-colonne z; pour 
lesquelles la ;-ième composante du premier membre de (7) est strictement 
positive. Considérons 


Il est aisé de montrer que x, et u, vérifient toutes les relations nécessaires, ce 
qui achève la démonstration. 

Démontrons maintenant le théorème de Farkas formulé de la façon sui- 
vante. 


THÉORÈME 2. Quelles que soient la matrice À à m lignes et n colonnes et 
la matrice-ligne b à n éléments, un et un seul des deux systèmes 


Ax > 0, bx<0 


el 


est résoluble. 


Remarquons tout d’abord que cette assertion coïncide en effet avec 
celle qui a été formulée au début de ce point : si le premier système est 
incompatible, 4x > 0 entraîne bx > 0, de sorte que le second système est 
compatible, c’est-à-dire que b est une combinaison linéaire positive des 
lignes de À. Inversement, si le premier système est compatible, bx > One 
se déduit pas de Ax > 0, si bien que le second système est incompatible, 
c’est-à-dire que b n’est pas une combinaison linéaire positive des lignes de 
À. 

Pour démontrer le théorème, considérons la matrice À déduite de À par 
adjonction de la ligne —b. En vertu de la proposition 15, il existe une 
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matrice-colonne x à ñ éléments et une matrice-ligne positive u à m + 1 
éléments, telles que 


Ax > 0, uA=0, ÀAx + 'u > 0. 


En dégageant le dernier élément de la matrice-ligne u 


u= lu, ...,u,,u,,,1 = llu,u,,.l, 
on obtient les relations suivantes : 
Ax 20, —-bx > 0, uA —u,,,,b = 0. 


Dégageons la dernière composante de la matrice-colonne Ax + ‘u : 
—bx +u,,, > 0. 


Cela veut dire que : soit u,,, > 0, soit bx < 0. Dans le premier cas, est 
compatible le second système : #4 = b, où 


1 20, 1=1,...,m. 


u9 = - 
u 


m+i 
Dans le deuxième, est compatible le premier système : 4x > 0, bx < 0. 
Démontrons que les deux systèmes ne peuvent à la fois être compati- 
bles. En effet, il découle des quatre relations que uAx > 0 et 
uAx = bx < 0. Le théorème est démontre. 
Si on remplace la matrice À par la matrice transposée ‘À, les matrices- 
lignes par les matrices-colonnes, et vice versa, on obtient la formulation 
équivalente suivante du théorème. 


CoROLLAIRE. Quelles que soient la matrice À et la matrice-colonne b, un 
et un seul des deux systèmes 


el 
uA > 0, ub < 0. 


est résoluble. 

Ce corollaire représente la condition d’existence de solutions positives 
pour le système d’équations linéaires. Il est utile de le comparer au théo- 
rème de Fredholm qu’on peut formuler de la façon suivante : 

Pour toute matrice À et toute matrice-colonne b un et un seul des deux 
systèmes 


et 
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est résoluble. (On laisse au soin du lecteur de démontrer que l’assertion 
donnée est équivalente au théorème de Fredhoim.) 

On est maintenant en mesure de démontrer le théorème inverse du théo- 
rème 1. Le théorème 1 et son inverse montrent que le cône polyédrique con- 
vexe peut être défini non seulement comme l'intersection d’une famille 
finie de sous-espaces mais aussi comme l’ensemble de toutes les combinai- 
sons linéaires positives d’un nombre fini de vecteurs. 


THÉORÈME 3. Soit .// l’ensemble de toutes les combinaisons linéaires 
positives des vecteurs a,, .…, a,,. Alors # est l'intersection d'une famille 
finie de sous-espaces. 


Soit À une matrice a n lignes et m colonnes a,, .…, a,. Le vecteur b 
appartient à .# si et seulement si b = Ax,x > 0. En vertu du corollaire du 
théorème 2 cette condition est équivalente au fait que l’inéquation ub > 0 
découle du système d’inéquations #4 > 0 ou, ce qui revient au même, du 
système ‘Au > 0. 

Notons u,, ..…., u,, la famille fondamentale de solutions du système 
uA > 0 et considérons le système d’inéquations 


u,b >0,..,u,b > 0 (9) 


par rapport à b. Le vecteur b vérifie ce système si et seulement s’il appar- 
tient à #. 

En effet, si ub > 0 pour toutes les solutions du système #4 > 0, le 
système (9) est en particulier aussi vérifié. Inversement, une solution arbi- 
traire u du système uA > 0 peut être représentée sous la forme u = 
= œu, +. + aju\, Où tous les æ,, .…, a, sont positifs. Donc, (9) 
entraîne l’inéquation ub > 0 pour un « arbitraire. 

Ainsi, le système d’inéquations (9) definit l’ensemble ., et le théorème 
est démontré. 

Remarquons que dans la démonstration on aurait pu choisir au lieu de 
u,, .…, uN une famille quelconque de matrices-colonnes qui engendre Île 
cône des solutions du système u 4 > 0. En prenant la famille fondamentale 
de solutions, on a obtenu pour .#un système contenant un nombre mini- 
mal d’inéquations. 

Pour un système d’équations linéaires homogènes il est facile de déga- 
ger un système équivalent composé d’un nombre minimal d'équations : il 
suffit pour cela de prendre les équations correspondant aux lignes du 
mineur principal de la matrice du système. Pour un système d’inéquations, 
il est plus difficile de le réaliser. L’affaire se réduit à la recherche de la car- 
casse d’un cône auxiliaire .# * engendré par les matrices-lignes des coeffi- 
cients d’inéquations du système de départ. On procédera dans la suite à 
l’étude détaillée de ces cônes. 
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4. Cônes duals. Soit .# un cône dans l’espace vectoriel Æ#. Considérons 
dans l’espace dual / * de l’espace _Z l’ensemble .# * composé de tous les y 
pour lesquels “*) 


{y,x ) 20, (10) 


quel que soit le vecteur x e .#. Si les vecteurs x,, .…, x,, définissent la car- 
casse du cône .#; la condition (10) est évidemment équivalente au système 
d’inéquations linéaires 

Cy,x ) 20, i=1,...,N. 


Ainsi, .# * est un cône. 


DÉFINITION. Le cône .# * dans l’espace #* défini par la condition (10) 
est dit dual du cône .# dans * . 

Supposons que le cône .#'est défini dans une base par le système d’iné- 
quations linéaires (2). Alors les lignes de la matrice À sont les lignes de 
coordonnées des vecteurs a!, ...,. a” de ,*. 1 va de soi que tous ces vec- 
teurs appartiennent à .#*. 

Siye.#*, c'est-à-dire si (y, x) > 0 pour tous les x e #, il existe 
selon le théorème de Farkas des coefficients positifs u,, .., u,, avec lesquels 
y se décompose suivant a!, .…, a”. Il en decoule la 


PROPOSITION 16. Les fonctions linéaires se trouvant dans les premiers 
membres des inéquations définissant le cône .# engendrent le cône dual 
AY. 

Considérons le cône .# ** dans Z , qui est dual du cône .#*. De par 
la définition, .#** est l’ensemble de tous les vecteurs x e Z tels que 
(y,x) > Opourtousles y e .#*. Il découle immédiatement de la défini- 
tion que .# © .# **. En se servant de la proposition 16, il n’est pas difficile 
de montrer que 


HS = (11) 


En effet, si x,, ..…., x, engendrent le cône .#, alors .#* est défini par le 
système d’inéquations linéaires { y, x; > 2 0, i = 1, .…, N, et par suite, 
.#*% est engendré par les mêmes vecteurs x,, .., x. 

La formule (11), ainsi que la proposition (16), est un corollaire immé- 
diat du théorème de Farkas. Inversement, ce théorème peut être obtenu 
facilement de la formule (11). Aussi, considère-t-on parfois la formule (11) 
comme l’énoncé du théorème de Farkas. 

Posons que les vecteurs x,, .…, x, de # engendrent le cône .#et que les 


*) On suppose que } représente une matrice-ligne et x unc matrice-colonne, de sorte que 
( Y,X ) = px. 
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vecteurs },, …, y,, de 7, * engendrent .#*. Considérons les nombres 


= (pit) ein Jedi M (12) 


Ils peuvent servir à composer une matrice À appelée matrice de définition 
double du cône .#: Les matrices-colonnes de H correspondent aux inéqua- 
tions du système définissant .# et les matrices-lignes aux vecteurs engen- 
drant .#: Le cône .# * possède une matrice de définition double ‘H. 

Il ne faut pas oublier que pour le cône considéré il existe plusieurs 
matrices de définition double, y compris des matrices de dimensions diffé- 
rentes. 

Si l’un des vecteurs y,, .…, y,, s'exprime linéairement au moyen des 
autres, la même dépendance est observée pour les colonnes de la matrice H. 
L’assertion inverse est vraie à condition que parmi x,, .…, x}, il y ait n vec- 
teurs linéairement indépendants, c’est-à-dire que le cône .# soit de dimen- 
sion n. Des assertions analogues sont aussi vraies pour les lignes de la 
matrice À. 

Dans la matrice de définition double, on s’intéresse habituellement aux 
éléments nuls. Pour décrire le cône, la grandeur des éléments strictement 
positifs n’est pas aussi essentielle. 

Les colonnes nulles de la matrice H correspondent aux contraintes- 
égalités du système définissant le cône. En effet, si une inéquation est véri- 
fiée en tant qu'égalité pour tous les x,, ., x,,, il en est de même pour toute 
leur combinaison linéaire. 

Il est aussi évident que les lignes nulles correspondent aux x; qui appar- 
tiennent à la face minimale du cône .# 

Ainsi, la matrice de définition double d’un cône pointé de dimension nr 
ne renferme pas de lignes et colonnes nulles. De ce qu’on vient de dire il 
découle la 


PROPOSITION 17. Si le cône .#’ est pointé, le cône # * est de dimension n. 
Si le cône .#' est de dimension n, le cône .# * est pointé. 


Admettons maintenant que le cône .#’est pointé et de dimension n (par 
suite, il en est de même du cône .# *). Dans ce cas, les carcasses de .#’et 
#* sont constituées d’arêtes. Composons la matrice de définition double 
en nous servant des vecteurs directeurs des arêtes. 

Chaque arête de .# vérifie 7 — 1 inéquations linéairement indépendan- 
tes en tant qu’égalités et au moins une inéquation en tant qu’inégalité 
stricte. Aussi, dans la matrice de définition double FH y a-t-il dans chaque 
ligne au moins 7 — 1 zéros situés dans les colonnes linéairement indépen- 
dantes et au moins un élément strictement positif. Il en est de même des 
colonnes de FH car ce sont les lignes de la matrice de definition double du 
cône .# *, composée pour ses arêtes. On a donc la 
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PROPOSITION 18. Chaque arête du cône pointé n-dimensionnel # est 
située sur une droite qui est l'intersection de n — 1 sous-espaces tels que les 
demi-espaces qu'ils limitent contiennent .#. Chacun de ces sous-espaces 
passe par n — 1 arêtes du cône .#; dont les vecteurs directeurs sont linéai- 
rement indépendants. 

5. Théorème de séparation. Considérons encore un résultat intimement 
lié au théorème de Farkas. C’est le théorème de séparation pour les cônes 
polyédriques convexes. 


THÉORÈME 4. Si le vecteur x, n'appartient pas au cône polyédrique con- 
vexe fermé .#, il existe un sous-espace (n — 1)-dimensionnel Z _, tel que 
x, Se trouve dans l'un des demi-espaces défini par _/,_,, tandis que le cône 
NW est situé dans l'autre, et x, n'appartient pas à 4 _;. 


Pour démontrer ce théorème, remarquons que, selon la formule (11), x, 
n'appartient pas à .#’**. Cela signifie qu’il existe un y e .#* pour lequel 
{Y,x% > <0.Siye.#*,ona € y,x > > 0 pour tout xe.#. Ainsi 
donc, le sous-espace dont on démontre l'existence est le sous-espace com- 
pose des vecteurs x satisfaisant à la condition € y, x > = 0. 

Il existe plusieurs variantes de ce résultat, et l’on peut même fournir un 
tel expose de la théorie des systèmes d’inéquations linéaires homogènes où 
les théorèmes de séparation se démontrent directement, alors le théorème 
de Farkas et les autres théorèmes sont leurs conséquences. 

6. Construction de la solution générale. On étudiera ici un des procédés 
de construction de la solution générale d’un système homogène d’inéqua- 
tions linéaires. En se servant d’une interprétation géométrique, on peut 
décrire ce procédé de la façon suivante. 

Une inéquation non triviale définit un demi-espace dont la carcasse 
peut être construite facilement. Supposons qu’on a déjà construit le cône 
À, des solutions du système de s inéquations et que la carcasse de ce cône 
est connue. Joignons à ce système encore une inéquation. Le demi-espace 
# qu’elle définit sépare du cône la partie 


Hu = ANA, 


s+]1 


qui est justement le cône des solutions du système de s + 1 inéquations. 
Ceci étant, dans le cas général, certaines arêtes du cône .# ne sont plus 
incluses dans .# et deviennent « séparées ». En revanche, on obtient dans 
Æ., , les nouvelles arêtes situées à l’intersection du sous-espace frontière 
du demi-espace .# avec les faces du cône .#. En joignant ainsi une à une 
toutes les inéquations, on obtient le système fondamental de vecteurs du 
cône qu’il nous faut. On étudiera plus loin en détail ce processus. 
Considérons le système de s inéquations linéaires homogènes 


afx = afxl +... + ax" 20, k=1,...,Ss. 
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définissant le cône .#, et soit x,, ..…, x,, une famille de génératrices (non 

nécessairement minimale) de ce cône. Cherchons l’intersection du cône .# 

avec le demi-espace .# défini par l’inéquation 


= b,x! +... + b x" > 0. 


Notons B. les nombres bx.,, j = 1, ..…, N, et rapportons le numéro j à 
l’une des trois classes 7,, 1_ ou J, suivant que le nombre B; est strictement 
positif, négatif ou nul. 

Si l’ensemble Z_ est vide, bx, > 0 pour tous les j et on constate facile- 
ment que # © .#. 

Supposons que c’est l’ensemble 7, qui est vide. Considérons une com- 
binaison linéaire des génératrices à coefficients positifs x = aœ,x, + … 

. + auXN. Si œ; > O pour au moins un j de 1_ ,onabx <0.ÏIlen 
découle que .#, , coïncide avec l’ensemble des combinaisons linéaires posi- 
tives des vecteurs x; pour tous les j e L,. 

Ainsi, on peut considérer que les deux ensembles 7, et Z_ ne sont pas 
vides. Soient ie JZ, et je Z_. Considérons le vecteur 


= B;x; — B;x;. 


On voit aussitôt qu'il vérifie : égalité bx;, = O et, par suite, appartient au 
sous-espace frontière / du demi-espace 4 Tout vecteur x e # N .#se 
décompose en une combinaison linéaire positive 


X = a, X; É Zi: À AnNXN: 


Un couple de termes a,x;, + a; x; de cette combinaison peut être représenté 
en fonction de x;; SOUS ‘la forme 


œ: 1 
= — {| y. se (5. 6.)x. 


B, . B; 


ou, si l’on exprime x; en fonction de x; et x, sous la forme 


@X, + ax, = ES + _ (x,B; + a;B;)x;. 
{ t 
Vu que B, > Oet p, < 0, les coefficients dans le second membre de l’une de 
ces expressions sont positifs pour tous a; et a; positifs. 
En remplaçant le couple de termes ax; + a;x; par Sa décomposition 
positive en x; et x;; OU en x; et x;,, On obtient la décomposition suivante du 
vecteur x : 


D ax + y x, + Y ax, + VX; 
kel’, ler help 


524 INÉQUATIONS LINÉAIRES ET PROGRAMMATION LINËAIRE [CH.XV 
e 
Ici le nombre total d’indices dans les ensembles 7° et 7” est d’une unité infé- 
rieur à celui des ensembles 7, et 7Z_. 
Si les deux ensembles 7° et 7° ne sont pas vides, on peut appliquer la 
même procédure à la décomposition obtenue. En substituant certains cou- 
ples de termes, on aboutit à la décomposition de la forme 


x = D Xe + y x, + y a,X, + Ÿ VX» 
kes 4 leJ_ help i, jeP 

où J, et J_ sont les ensembles de numéros des vecteurs restants, avec 
B, > OetB, < 0 respectivement ; P est l’ensemble des couples de numéros 
étudiés. Le processus peut continuer tant que l’un des ensembles J, ou J_ 
ne devienne vide. 

Si le vecteur x appartient au demi-espace .#/et que J_ ne soit pas vide, 
l’ensemble J, ne peut être vide. En effet, si J, était vide et J_ non vide, on 
aurait 


bx = D a, B, < 0 
leJ_ 


car tous les x. et x, pour h € J, se trouvent dans le sous-espace 

Ainsi, dans tous les cas, l’ensemble J_ obtenu à la fin du processus est 
vide, et l’on a démontré que le vecteur x e # N .# peut être représenté 
comme une combinaison linéaire positive de vecteurs x; pour ie 7, U Jet 
de vecteurs x; pour iel,,jel_. 

D'autre part, il est évident que toutes ces combinaisons linéaires appar- 
tiennent à l'intersection .# N .#. On a ainsi obtenu la. 


PROPOSITION 19. Si {x,, .., x,,] est une famille de génératrices du cône 
Æ#, alorsx, ie, UL,et X;;, iel,,jel_,/forment une famille de géné- 
ratrices du cône .#., ;. 


Cette proposition peut être utilisée à la recherche de la solution générale 
du système d’inéquations linéaires homogènes si l’on joint successivement 
des inéquations à la première inéquation du système. Pour commencer, on 
peut se servir de l’inégalité triviale identiquement vérifiée Ox > 0, mais il 
n’est pas difficile d’indiquer une famille fondamentale de solutions pour 
une inéquation non triviale. On a montré dans la proposition 11 comment 
construire la carcasse d’un sous-espace. Démontrons maintenant la propo- 
sition suivante. 


ProPostriON 20. La carcasse du demni-espace défini par l'inéquation 
ax = ax +... +ax" >0 


s'obtient par adjonction du vecteur ‘a = ‘la,, .…., a, à la carcasse du 
sous-espace frontière f. 
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Il est évident que ‘a appartient au demi-espace et n’appartient pas au 
sous-espace frontière. Considérons un vecteur arbitraire x pour lequel 
ax = à > 0. Ce vecteur peut être représenté sous la forme 

a'a 
X=—— + ÿ 
a'a 


où y e “ En effet, dans ce cas ay = 0, vu que 


œa'a 
ax = @œ = —— + ay. 
a'a 
Donc, ‘a et la carcasse de _/constituent la famille complète des solutions 
de l’inéquation ax > 0. Il n’est pas difficile de montrer que cette famille 
cesse d’être complète sans l’un quelconque de ses vecteurs. 

Il faut remarquer que l’application directe de la proposition, lorsqu'on 
joint à la famille complète donnée tous les x,,, ie 7, etj e 1_, conduit à des 
familles complètes contenant un trop grand nombre de vecteurs. Décrivons 
un procédé permettant de diminuer le nombre de vecteurs introduits à cha- 
que étape. Pour simplifier, limitons-nous au cas d’un cône pointé de 
dimension n. On trouvera l’exposé du cas général dans le livre de Tcherni- 
kov [36]. 

Considérons l'intersection .#,, d’un cône pointé n-dimensionnel .# 
avec un demi-espace .# de sous-espace frontière Æ Le système d’inéqua- 
tions de .#,, est obtenu par adjonction de l’inéquation 


s+lyl +] 
aix +... + aÿ*'x" > 0 


définissant .#au système d’inéquations du cône .#. Ainsi, le système 
d’inéquations 


(13) 


+11 s+lyn 
aÿtlx!l +... + as*t'x" > 0 


définit .#,,. Toutes les arêtes de .#,, appartiennent à l’ensemble des 
demi-droites qui annulent n — 1 inéquations linéairement indépendantes 
du système (13). Ces demi-droites sont les arêtes de .# et les intersections 
de _ avec les faces bidimensionnelles de .# ne se trouvant pas entièrement 
dans _/: Donc, la carcasse de .#. , se déduit de celle de .# par élimination 
des arêtes ne se trouvant pas dans .# et par adjonction des intersections de 
_/ avec les faces bidimensionnelles de .# qui ne sont pas contenues dans Z° 

Il se pose le problème de déterminer lesquelles des arêtes du cône .# 
sont voisines au sens qu’il existe une face bidimensionnelle qui passe par 
elles. On peut le faire en recourant à la matrice H de définition double du 
cône .# si les lignes de la matrice correspondent aux arêtes. Une face bidi- 
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mensionnelles se définit par conversion en égalités exactes des 7 — 2 iné- 
quations linéairement indépendantes du système. Aussi, les lignes de la 
matrice H correspondant aux arêtes voisines possèdent-elles des zéros dans 
les mêmes 7 — 2 colonnes, ces colonnes étant linéairement indépendantes. 

Il n’est pas difficile de vérifier que dans ce cas les éléments de ces 7 — 2 
colonnes ne sont simultanément nuls dans aucune autre ligne. En effet, cela 
signifierait que trois arêtes différentes du cône sont incluses dans une même 
face bidimensionnelle, ce qui contredit la proposition 12. 

Notons qu'après avoir trouvé les arêtes du cône .#, , on peut construire 
sa matrice de définition double et continuer à joindre les inéquations. 

L'hypothèse que le cône .# est pointé et de dimension n ne sera restric- 
tive qu'aux premières étapes du processus, tant que le nombre total d’iné- 
quations linéairements indépendantes est strictement inférieur à la dimen- 
sion de l’espace. Cette hypothèse peut aussi s’avérer restrictive à toute 
étape s’il apparaît des contraintes-égalités. 

Le processus peut débuter avec le cône pointé si le système donné d’iné- 
quations linéaires contient un sous-système de #7 inéquations indépendantes 
dont la famille fondamentale de solutions peut facilement être obtenue ; en 
particulier, si le système contient les inégalités x! > 0, ...,x" > O. 

Sous ce rapport, il faut remarquer qu’en augmentant le nombre de 
variables, on peut transformer le système d’inéquations linéaires homogè- 
nes en un système à variables positives. Pour cela, au lieu de chaque varia- 
tle x' non soumise à la condition x > 0 il faut introduire deux variables 
positives y’ et z' et porter y’ — z' dans le système au lieu de x’. D’après la 
solution générale du système transformé on peut facilement construire la 
solution générale du système initial. 


$ 2. Systèmes d’inéquations linéaires non homogènes 


1. Ensembles convexes dans un espace affine. On étudiera dans ce para- 
graphe les systèmes d’inéquations linéaires non homogènes de la forme 


Ax > b, (1) 
ou sous une forme plus détaillée 
1 i 
a,X +. +4a,x" 20, 
aux +. + 4,,x" > DT. 


Comme dans le cas de systèmes homogènes on ne restreint pas la généralité 
en supposant que toutes les inéquations sont écrites avec le signe >. 

En recherchant une interprétation géométrique convenable pour les 
solutions des systèmes d’inéquations non homogènes, on peut examiner un 
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cas particulier bien connu, celui des systèmes d’équations linéaires. Les 
systèmes d'équations linéaires non homogènes s’interprètent le plus natu- 
rellement dans un espace affine (ponctuel) (voir $ 1, ch. IX) rapporté à un 
repère cartésien | O, e}, dans lequel à chaque point X est associé son rayon 
vecteur OX et sa colonne de coordonnées x dans e, dite aussi colonne de 
coordonnées du point X. 

Les solutions du système d’équations linéaires non homogènes se repré- 
sentent dans ce cas par des points, et l’ensemble de ces solutions par un 
plan. Il est naturel de représenter les solutions du système homogène asso- 
cié par des vecteurs. Dans ce cas, l’ensemble de toutes les solutions du 
système homogène associé est le sous-espace directeur du plan défini par le 
système non homogène. 

On agira de même avec les systèmes d’inéquations linéaires non homo- 
gènes en représentant leurs solutions par des points de l’espace affine. 

Ce point est consacré à une classe importante d’ensembles dans l’espace 
affine, les ensembles convexes. 

Admettons que le système d’inéquations linéaires (1) est compatible et 
que x,, .…, x, sont ses solutions. Si les coefficients @,, .…., a, satisfont aux 
conditions 


a, > 0,...,a, > 0, æœ, + … + a, = 1, (2) 


la combinaison linéaire 
X = QX, + … + A X, (3) 


est également une solution du système (1). Ces combinaisons linéaires de 
colonnes dont les coefficients satisfont à la condition (2) sont appelées 
combinaisons convexes. Le point X dont la colonne de coordonnées est une 
combinaison convexe des colonnes de coordonnées des points X,, …, X est 
appelé combinaison convexe de ces points. 

Notons que tout cela est vrai, quel que soit le repère choisi. Il va de soi 
que les coefficients de la combinaison linéaire ne varient pas dans tout 
changement de base et que de plus l’origine du repère peut être déplacée 
d’un vecteur quelconque. En effet, il résulte de (3) que 


x + p = (x, + p) +... + a.(x, + p). 

Soit . un ensemble de points de l’espace affine. On appelle enveloppe 
convexe de l’ensemble .:# l’ensemble de toutes les combinaisons convexes 
des points de .# 

EXEMPLES. 1) Montrons que le segment X, #, est l’enveloppe convexe de 
ses extrémités. Le segment se trouve sur la droite d’équation paramétrique 


X=Xx, + ((x — x), 


où x, et x, sont les colonnes de coordonnées des extrémités du segment. 
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Ceci étant, un point de paramètre / appartient au segment si et seulement si 
te [0, 1]. Aussi, en transformant l’équation de la droite à la forme 


obtient-on à«, = 1-1 >0,a, = 1 >0et a, + «, = 1, ce qu'il fallait 
montrer. 

2) Supposons que les points X,, #, et X, ne se trouvent pas sur une 
même droite. Choisissons un quatrième point © non situé dans le plan bidi- 
mensionnel . passant par X,, X, et X,. Dans le plan tridimensionnel 
engendré par les points O, X,, X,, X,, choisissons un repère d’origine O et 
de base {OX,, OX,, OX,]. Dans ce repère, le plan 3 a pour équation 
@, + @, + æ;, = 1. Aussi l'intersection du plan .;; avec l’octant positif du 
repère considéré est-elle justement l’enveloppe convexe des points X,, X, 
X,. Ainsi, l'enveloppe convexe de trois points non alignés est un triangle de 
sommets en ces points. 

3) Supposons que les points X,, X,, X, sont alignés et que X, se trouve 
entre X, et X,. Montrons que leur enveloppe convexe est le segment XX. 
En effet, suivant l’hypothèse faite, il existe un nombre « € [0, 1] tel que 
x, = ax, + (1 — æ)x,. Soit y = Àx, + ux, + vx,, où À, y et » sont 
positifs et leur.somme vaut 1. Alors 


y = (À + aux, + (v + (1 — a)u)x.. 
Il est évident que les coefficients de cette combinaison sont positifs et 
À +oautv+(l — au = 1, 


ce qui démontre la proposition. 

Un ensemble de points de l’espace affine est dit convexe si avec tout 
couple de ses points il contient le segment dont ces points sont les extrémi- 
tés. Remarquons que l’ensemble vide et le singleton sont des ensembles 
convexes. 

Il est aisé de constater que sont convexes : l’espace entier, le demi- 
espace limité par un hyperplan arbitraire (voir $ 1, ch. IX), le plan de 
dimension quelconque, en particulier, la droite. Le disque dans le plan 
euclidien est un ensemble convexe, mais le cercle ne l’est pas. 

Il découle directement de la définition que l’intersection de toute 
famille (non nécessairement finie) d’ensembles convexes est convexe. 


PROPOSITION 1. L'enveloppe convexe de tout ensemble est un ensemble 
convexe. 


En effet, supposons que les points Z; et Z, appartiennent à l’enveloppe 
convexe de l’ensemble . Cela signifie que leurs colonnes de coordonnées 


peuvent être représentées sous forme de combinaisons convexes 
Zy = AX) +. + ax, 


$ 2] SYSTÈMES D'INÉQUATIONS LINÉAIRES NON HOMOGÈNES 529 


et 

Z) = 8,7, + … + B,y, 
de colonnes de coordonnées de points appartenant à Si les nombres À et 
u sont tels que À > O,u > 0Oet+u=1l,ona 


NZ, + uZ;, = y (Aa;)x, + y (uB;)y;. 
is] j=i 


Ceci étant, tous les coefficients sont ici positifs et 


s t 
D Qu) + YUB)= A+. 
i-] je! 

Ainsi, le segment d’extrémités Z, et Z, est de même contenu dans l’enve- 
loppe convexe de l’ensemble % si bien que la proposition est démontrée. 


PROPOSITION 2. Si les points X,, ..., À. appartiennent à l’ensemble con- 
vexe ®, toute leur combinaison convexe appartient aussi à cet ensemble. 


Démontrons cette proposition par récurrence sur le nombre de points. 
Pour deux points l’assertion se confond avec la définition de l’ensemble 
convexe (voir exemple 1)). 

Soit une combinaison convexe X des points X,, .…, X,. Sa colonne de 
coordonnées x s’exprime en fonction des colonnes de coordonnées de ces 
points par la combinaison convexe 


X = AX, + .… + ax. 
Si a, = 0, l’assertion se réduit immédiatement à l’hypothèse de récur- 
rence. Si «, = 1, les coefficients sont nuls, si bien que l’assertion est tri- 
viale. 
Dans le cas général de 0 < a, < 1, introduisons les nombres 
œ. 

B=—1—, j=1,..,k-1 

7 =", 
Ils sont tous positifs et de plus 

k-1 


k-1 
| 1 
. = ————— . = 1 — 1; 
DE Pers re 4) 
j=1 


J=1 


Par conséquent, selon l’hypothèse de récurrence, y = B,x, + … 
… + B,_,x,_, € 2. En vertu de la convexité de Z on a alors a,x, + 
+ (1 — a,)y € 2, c'est-à-dire que 


OX, Has A + ax, € ?, 


ce qu’il fallait démontrer. 
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Il découle de la proposition 2 que tout ensemble convexe Z qui contient 
l’ensemble contient aussi son enveloppe convexe. Ce fait et la proposi- 
tion 1 entraïnent la 


PROPOSITION 3. L enveloppe convexe de l’ensemble © est l'intersection 
de tous les ensembles convexes contenant À 


Un ensemble :Z de points de l’espace affine est dit borné si dans un 
repère toutes les coordonnées de tous ses points sont en valeur absolue bor- 
nées par un même nombre. Ceci est équivalent au fait que l’ensemble des 
colonnes de coordonnées des points de & est borné en c-norme. En vertu 
du théorème 1, $ 3, ch. XI, on peut en conclure qu’un ensemble dans 
l’espace affine est borné si et seulement si l’ensemble correspondant des 
colonnes de coordonnées est borné en une norme quelconque. 

Il n’est pas difficile de montrer que la définition donnée est indépen- 
dante du choix du repère. En effet, quand on change de repère, on rem- 
place la colonne de toordonnées x par x’ = Sx + p, et l’on peut écrire 


l'estimation 
Ix' 1, < IS xl, + pl, 


qui entraîne l’assertion nécessaire. 


PROPOSITION 4. Si l’ensemble À est borné, il en est de même de son enve- 
loppe convexe. En particulier, l'enveloppe convexe d’un ensemble fini est 
bornée. 


DÉMONSTRATION. Pour la colonne de coordonnées d’un point quelcon- 
que de l’enveloppe convexe on a la décomposition 


Y = OX, + .… + ax, 


qui est une combinaison convexe des colonnes de coordonnées des points 
de . D'où il vient 

$ S 
y < y ax. < max fx; ll D a, = max x; fl. 
i-] 


i=l 


Etant donné que Zest borné, il existe un nombre p tel que Ixi < p pour 
tous les X e . Donc, max xl < pet Iyl < », ce qu’il fallait démon- 
{ 


trer. 

Rapportons l’espace affine à un repère choisi. Toute inéquation linéaire 
à coefficients non nuls définit alors un demi-espace fermé par rapport au 
plan ne passant en général pas par l’origine du repère. Le système de ces 
inéquations définit l’intersection des demi-espaces correspondants. L’iné- 
quation triviale (dont le premier membre est nul) est soit incompatible, soit 
vérifiée identiquement. Par conséquent, l’adjonction de ces inéquations ou 
bien ne modifie pas l’ensemble de solutions, ou bien le rend vide. 
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L’intersection de demi-espaces est un ensemble convexe, vu que chaque 
demi-espace est convexe. 


DÉFINITION. L’intersection de demi-espaces de l’espace affine s’appelle 
ensemble polyédrique convexe. Si l’ensemble polyédrique convexe est 
borné, on l’appelle po/yèdre convexe. 

En vertu de cette définition, l’ensemble des solutions d’un système 
d’inéquations linéaires non homogènes est représenté par un ensemble 
polyédrique convexe. 

Les cônes polyédriques convexes définis au $ 1 peuvent être aussi consi- 
dérés comme des ensembles ponctuels dans l’espace affine. Ils constituent 
alors un cas spécial d’ensembles polyédriques convexes dont les plans fron- 
tières de tous les demi-espaces passent par un même point, l’origine des 
coordonnées. 

2. Ensemble des solutions d’un système d’inéquations linéaires non 
homogènes. On a vu que l’ensemble des points représentant les solutions 
du système de la forme (1) est l’intersection de demi-espaces et par suite, est 
un ensemble convexe. On a même donné un nom à ces ensembles. 
Etudions-les maintenant plus en détail. A cet effet, introduisons une varia- 
ble supplémentaire x" * ! et considérons le système 


Ax — x'"tib > 0, 
xt > 0. 


(4) 


Pour chaque solution x du système (1) la matrice-colonne g = ‘Îl'x, 11 
vérifie le système (4) et, inversement, si x”*! = 1, les ñ7 premiers éléments 
de la solution du système (4) vérifient le système (1). 

Notons {p,, .…, p,] la famille fondamentale de solutions du système (4) 
et admettons que p,, …, p, sont numérotées de telle sorte que la dernière 
composante dans les matrices-colonnes p,, .…, p, soit strictement positive et 
dans les matrices-colonnes p,,,, ..…., p, soit égale à zéro. De plus, on peut 
même considérer que la dernière composante dans p,, ..…, p, est égale à 1, 
vu que toute matrice-colonne peut être remplacée par une colonne propor- 
tionnelle, avec facteur de proportionnalité strictement positif. 

Si le système (1) est compatible, : > 1. En effet, dans le cas contraire, 
pour tous x et x”* ! il ressort de 4x — x"*!b > Oquex”*! = Oet, en par- 
ticulier, pour la solution x du système (1) il découle de 4x — b > 0 que 
l:= 0: 

Toutes les solutions du système (4) et elles seules peuvent être représen- 
tées par la formule 


g= ap, +... + ap, + B,p,,, + .… + B._,p, (S) 
à coefficients positifs æ; et b; . Ceci étant, en vertu des hypothèses faites, la 


34 
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dernière composante de la matrice-colonne g est égale à 1 si et seulement si 
EE PPS NE RS © 


L'égalité obtenue est nécessaire et suffisante pour que les nr premières 
composantes de la matrice-colonne (5) représentent une solution du 
système (1). A cette condition, en rejetant les derniers éléments de toutes les 
matrices-colonnes dans la formule (5), on aboutit à la so/ution générale du 
système d’inéquations linéaires (1). 

Du point de vue géométrique, l’adjonction de la variable supplémen- 
taire x”*! signifie le passage à l’espace (7 + 1)-dimensionnel dans lequel 
l’espace n-dimensionnel de départ est un hyperplan d’équation x"+! = 1. 
Le système d’inéquations homogènes (4) définit un cône polyédrique con- 
vexe #. L'ensemble des solutions du système (1) est l’intersection du cône 
et de l’hyperplan x7+! = 1. 

Pour x"*! = 0, le système (4) se transforme en un système homogène 


Ax > 0. (6) 


Les solutions de ce système seront représentées sous forme de vecteurs. Vu 
que la dernière composante de chacun de ces vecteurs est égale à zéro, ces 
derniers se trouvent dans le sous-espace directeur de l’hyperplan x7*+! = 1. 
Le système (6) définit dans ce sous-espace un cône polyédrique convexe .#-: 
On voit aussitôt que p,,,, …, p, sont les colonnes de coordonnées des vec- 
teurs de la carcasse de .# 

Les matrices-colonnes p,, .…., p, seront assimilées aux colonnes de coor- 
données des points P,, ..…, P,. Alors le premier groupe de termes dans la 
formule (5) constitue une combinaison convexe des points P,, …, P,, et le 
second groupe, un vecteur du cône .#. Ainsi, on est en mesure de formuler 
le théorème suivant qui est la traduction géométrique de la formule (5). 


THÉORÈME 1. Soit .# un ensemble polyédrique convexe. Il existe une 
enveloppe convexe d’une famille finie de points Set un cône polyédrique 
convexe .# tels que tous les points de .# et eux seuls sont les extrémités des 
vecteurs de .# issus des points de ?. 


Supposons que le système (6) n’a qu’une solution triviale. Le cône 
est alors composé du vecteur nul, de sorte que l’ensemble 7 se confond 
avec #et, par suite, est borné. Par contre, si .*# contient un vecteur non 
nul, en le multipliant par un coefficient suffisamment grand on peut obte- 
nir un point de l’ensemble .# dont certaines coordonnées sont en valeur 
absolue aussi grandes que l’on veut. On a donc le corollaire suivant. 


CoOROLLAIRE. Un ensemble polyédrique convexe défini par le système (1) 
est un polyèdre si et seulement si le système homogène associé ne possède 
qu'une solution triviale. 
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Un autre cas particulier limite se présente pour £ = 1. Dans ce cas 
l’ensemble est composé d’un seul point et .#est alors un cône polyédri- 
que convexe, considéré comme ensemble ponctuel. 

Démontrons le théorème inverse du théorème 1. 


THÉORÈME 2. Supposons que l'ensemble ‘est l'enveloppe linéaire d'une 
famille finie de points, .# un cône polyédrique convexe et .W un ensemble 
de points qui sont des extrémités des vecteurs de .*# issus des points de 
M est alors un ensemble polyédrique convexe. 


DÉMONSTRATION. La colonne de coordonnées d’un point arbitraire X de 
M est de la forme 


x= ax, + … + a,x, + B,l +... + B,1,, 


où x,, …, x, et l,, …, {, sont les colonnes de coordonnées respectivement 
des points qui engendrent Set des vecteurs qui engendrent .# Tous les 
coefficients sont positifs et œ, + … + aœ, = 1. Notonsp,,i = 1,..., ft, les 
matrices-colonnes déduites de x; par adjonction de la dernière composante 
égale à 1, et g,j = 1, .…, h, les matrices-colonnes déduites de l par 
adjonction de la dernière composante égale à 0. 

L'ensemble de toutes les combinaisons linéaires positives des matrices- 
colonnes p; et q; 


X = QP, + .… + ap, + B,q, + .… + B,q, 


est un cône polyédrique convexe # dans l’espace vectoriel de dimension 
n + 1. Selon le théorème 3 du $ 1, il existe un ensemble de matrices-lignes 
a!,..,aNàn + 1 éléments, telles que x e .Ÿ si et seulement si 


akx > 0 


pour tous les # = 1, ..., N. Ecrivons ces inéquations d’une façon plus 
développée et tenons compte du fait que la somme des coefficients æ;, vaut 
l’unité. Il vient 


! h 
ax = y a,(akx,) + D a,a*,, + D B;(a*i) = aXx +a  >0. 
(=) j=1 


n+] 
OCR | 
Or Xe # si et seulement sixe # Donc, Xe .#'si et seulement si sa 


colonne de coordonnées vérifie le système d’inéquations linéaires non 
homogènes 


Kk 
aXx + d., 


>.0, KL = 1...,N. 
Le théorème est démontré. 


CoRoOLLAIRE. L'’enveloppe convexe d’un ensemble fini de points est un 
polyedre convexe. 
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3. Faces d’un ensemble polyédrique convexe. On dit qu’un ensemble 
polyédrique convexe non vide est de dimension d s’il est situé dans un plan 
de dimension d et n’est situé dans aucun plan de dimension inférieure. 

Les inéquations figurant dans le système non homogène de fa forme (1) 
peuvent être partagées en contraintes-égalités et contraintes-inégalités, 
comme cela a été fait au $ 1 relativement aux inéquations homogènes. Par 
contraintes-égalités on entend des inéquations qui se vérifient pour les solu- 
tions du système en tant qu'égalités exactes. 


PROPOSITION 5. La dimension de l'ensemble polyédrique convexe 
A{ défini par le système (1) est égale à n — bp, où p est le rang de la matrice 
Jormée de tous les coefficients des contraintes-égalités. 


La démonstration s’appuie sur des raisonnements analogues à ceux uti- 
lisés lors de la démonstration des propositions 2 à 5 du $ 1. En remplaçant 
le signe > par = dans les contraintes-égalités on obtient les équations du 
plan .”,_, de dimension n — p, où se trouve l’ensemble polyédrique .#. Si 
l’on exprime p variables à partir de ces équations et qu’on les porte dans les 
inéquations restantes, on aboutit à un SES" de contraintes-inégalités qui 
définit 7 dans le plan.“ 

Considérons ensuite A , Comme un espace indépendant et montrons 
que l’ensemble défini par le système de contraintes-inégalités n’est situé 
dans aucun hyperplan. A cet effet, montrons d’abord que le système cor- 
respondant d’inéquations strictes a une solution x,. En effet, chaque iné- 
quation devient une inégalité stricte en un certain point de l’ensemble .#. 
Par conséquent, toute combinaison convexe de ces points à coefficients 
non nuls est la solution x, cherchée. 

Il n’est pas difficile de démontrer que x, est un point intérieur à 
l’ensemble au sens qu’il lui appartient avec un voisinage de dimension 
n — p. On peut en déduire l’assertion nécessaire par analogie à la démons- 
tration de la proposition 5 du $ 1. 


DÉFINITION. On appelle face de l’ensemble polyédrique convexe défini 
par le système (1) un ensemble polyédrique convexe de solutions d’un 
système déduit de (1) par substitution des égalités à certaines contraintes- 
inégalités. 

Les faces unidimensionnelles sont appelées arêtes et les faces de dimen- 
sion zéro, sommets de l’ensemble polyédrique convexe. 

Tout ensemble polyédrique convexe unidimensionnel est soit une 
droite, soit une demi-droite, soit un segment. Par conséquent, si les arêtes 
existent, elles ne peuvent être que des trois espèces énumérées plus haut. 
Dans un polyèdre convexe borné, les arêtes ne peuvent être que des seg- 
ments. 

Un ensemble polyédrique £-dimensionnel est situé dans un plan de 
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dimension & et (s’il n’est pas vide et ne coïncide pas avec tout le plan) y est 
défini par un système d’inéquations contenant des contraintes-inégalités 
non triviales. Aussi l’ensemble polyédrique £-dimensionnel possède-t-il des 
faces (£ — 1)-dimensionnelles obtenues par substitution d’une équation à 
l’une de ces contraintes. Remarquons que toutes les faces ne peuvent pas 
être vides. S’il en était ainsi, l’ensemble polyédrique se composerait des 
solutions du système des contraintes-inégalités strictes. Alors par un rai- 
sonnement anologue à celui de la démonstration de la proposition 4 du $ 1 
on pourrait démontrer que cet ensemble est ouvert. Or, étant une intersec- 
tion d’ensembles fermés, il doit être fermé. On n’examinera pas ici ce fait 
en détail car il resulte directement du théorème 7 qu’on démontrera plus 
loin. 

Ainsi donc, un ensemble polyédrique convexe non vide de dimension K, 
non confondu avec le plan k-dimensionnel doit admettre des faces 
(Æ — 1l)-dimensionnelles. Mais on ne peut affirmer qu’il possède des faces 
de dimension inférieure, vu qu’une face (£Æ — 1)-dimensionnelle peut être 
un plan de dimension & — 1. Plus précisément on a la 


PROPOSITION 6. Un ensemble polyédrique convexe défini par un système 
d'inéquations linéaires à matrice À de rang r ne peut avoir de faces de 
dimension inférieure à n — r. 


En effet, pour que la face soit de dimension K, elle doit transformer en 
équations z — k inéquations linéairement indépendantes du système. Or le 
nombre total d’équations linéairement indépendantes déduites du système 
(1) est au plus égal à r. 

Il découle de la proposition démontrée que pour l'existence des som- 
mets d’un ensemble polyédrique convexe il est nécessaire que nr = r. 
Démontrons que cette condition est suffisante, c’est-à-dire qu’on a la pro- 
position suivante. 


PROPOSITION 7. Un ensemble polyédrique convexe non vide .# défini par 
le système (1) possède des sommets si et seulement si les colonnes de la 
matrice du système sont linéairement indépendantes. 


DÉMONSTRATION. Soit r = n. Le cône .# défini par le système (4) est 
alors pointé, car le système d’équations 


Ax — x'tlb = 0, 

x'"+! — 0 
n’a qu’une solution triviale. Donc, chacune des matrices-colonnes Pis +. 
, P, de la formule (5) définit une arête du cône .# et, par suite, trans- 


forme en équations 7 (nombre de variables inférieur de l’unité) inéquations 
quelconques linéairement indépendantes du système (4). Pour les matrices- 
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colonnes p,, …, p, la dernière inégalité n'intervient pas parmi les nr inéqua- 
tions transformées, car x” +! y est égal à 1. Donc, les n premiers éléments de 
chacune des colonnes vérifient les 7 inéquations linéairement indépendan- 
tes du système (1) en tant qu’égalités exactes. Il en découle que les 7 pre- 
miers éléments des colonnes p,, .…, p, constituent les colonnes de coordon- 
nées des sommets de l’ensemble polyédrique .#. La proposition est démon- 
trée. 

Dans l’exposé ultérieur, il ne nous faudra pas changer de repère. Aussi, 
pour faciliter l’exposé, identifiera-t-on un point ou vecteur à une colonne 
de coordonnées associée. On transforme ainsi l’espace affine en espace 
arithmétique dans lequel on étudiera les objets de l’espace affine : points, 
vecteurs, plans de différentes dimensions, etc. 

De toutes les propriétés des faces de dimension arbitraire démontrons la 
suivante : 


PROPOSITION 8. Soit X ‘ une face de l’ensemble polyédrique .4. Si un 
point xEe M‘ se représente comme une combinaison convexe 


X = a;,X; sus a Xr 


à coefficients non nuls des points x,, …, x, de #, ces points appartiennent 
tous à À. 

Pour démontrer l’assertion, considérons une inéquation arbitraire 
aix > b' du système (1), qui devient égalité sur la face .# ‘. On a 


a'x = œja'X, + .… + œ,a'x,. 
Pour tous les j on a ici a'x, > b'. Si pour un j, est vérifié aix, > bi, il 
ressort de æ«, > 0,..., œ, > Oet de œ, + .… + æ, = 1 que aix > bi. La 
contradiction obtenue démontre la proposition. 


DÉFINITION. Un point x de l’ensemble convexe .#sera appelé point 
extrémal si de x = ax, + (1 — a)x, pour 0 < & < 1 et x,, x, e #il 
résulte quex = x, = x,. Autrement dit, un point extrémal n’est intérieur à 
aucun segment inclus dans .#. 


PropPosiTion 9. Les sommets d’un ensemble polyédrique convexe et eux 
seuls sont ses points extrémaux. 


DÉMONSTRATION. Si x est un sommet, c’est-à-dire une face de dimension 
0 de l’ensemble .#, il découle de x = ax, + (1 — a)x,, 0 < œ < let x,, 
x, € .#, en vertu de la proposition 8 que x, et x, sont situés dans la même 
face de dimension 0 et, par suite, coïncident avec x. Ainsi, tout sommet est 
un point extrémal. 

Démontrons que tout point extrémal est un sommet. Vérifions d’abord 
que si un point extrémal existe, on an = Rg 4. En effet, si y est une solu- 
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tion non triviale du système d’équations Ay = 0, chaque solution x du 
système (1) peut être considérée comme le milieu du segment d’extrémités 
x + yet x — y qui sont aussi des solutions du système (1). 

Démontrons ensuite que la décomposition du point extremal suivant la 
formule (5) ne contient pas de termes de numéros strictement supérieurs à 
t. En effet, soit x le point extrémal. Dans ce cas, la matrice-colonne 
q = ‘ll'x, 11 peut être représentée par la formule (5) sous la forme 


g = pp, + .… + ap, + BipP,,, + .… + B,_,P.;, 
oug=u+uv,avecu = @p, + .… + a,p,etu = B,p,,, +. + B._,p.. 
1 3 
Les matrices-colonnes u + 3 vet u + 3 v correspondent aux points de 


l’ensemble #, et le point g est le milieu du segment limité par ces points, à 
condition que vu # 0. 
Ainsi, pour le point extrémal on a 


qg = ap; Tiis T @,P, : 


Il en découle que g se confond avec l’un des p,, .…, p,. En effet, soit par 
exemple œ, # 0. Si æ, + .. + a, = 0, la démonstration est immédiate. 
Dans le cas contraire, on ag = a,p, + (1 — «,)p,, où 


Po = (œ + .… + a)" (ap, + … + @p,), 


et de la définition du point extrémal il découle que g = p, = ps. 

Or on a vu en démontrant la proposition 6 que si les sommets existent, 
les matrices-colonnes p,, .…, p, définissent justement les sommets, ce qui 
achève la démonstration. 


CoROLLAIRE. Le nombre des sommets d'un ensemble polyédrique con- 
vexe est fini. 

. En effet, si les sommets existent, ils sont des points extrémaux. Or les 
points extrémaux se définissent par les matrices-colonnes p,, …, p,. Donc, 
tous les sommets sont définis par ces colonnes. 

Si l’ensemble polyédrique convexe défini par le système (1) est borné, le 
système homogène (6) n’a qu’une solution triviale et, par suite, n = r, de 
sorte que le polyèdre convexe possède nécessairement des sommets. On 
aboutit au théorème suivant. 


THÉORÈME 3. Un polyèdre convexe possède des sommets (points extré- 
maux) et constitue l'enveloppe convexe de ses sommets. 


Ce théorème est un cas particulier du théorème plus général d’après 
lequel chaque ensemble convexe borné admet des points extrémaux et cons- 
titue l’enveloppe convexe de ces points. Dans le cas général, l’ensemble des 
points extrémaux est infini. Par exemple, les points extrémaux d’une boule 
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sont les points de la sphère frontière. On trouvera la démonstration de ce 
théorème général par exemple dans le livre de Nikaïdo [29]. 

Servons-nous du théorème de séparation pour les cônes polyédriques 
convexes et du passage d’un système d’inéquations non homogènes à un 
système homogène associé pour obtenir le théorème de séparation pour les 
ensembles polyédriques convexes. 


THÉORÈME 4. Soit Az < b. Il existe une matrice-ligne v et un nombre w 
tels que vz + w < 0, et pour toutes les solutions du système Ax > bona 
ux + w > 0. 


DÉMONSTRATION. Notons que la matrice-colonne z déduite de z par 
adjonction de la dernière composante égale à 1 n’appartient pas à l’ensem- 
ble des solutions du système homogène (4) : 


Ax — bx'"*l > 0, 
x'+! > 0. 


Selon le théorème 4 du $ 1 il existe une matrice-ligne v à n + 1 éléments 
pour laquelle vuz < Oet vx > 0 quelles que soient les solutions du système 
(4), en particulier celles dont la dernière composante vaut 1. Les 7 premiëé- 
res composantes de chacune de ces solutions vérifient le système Ax > b. 
Inversement, si x est solution du système Ax > b, alors x = ‘ll ‘x, 11 est 
celle du système (4).  . 

Soit u = lv, wi. Alorsuz = uz + w < Oetux = ux + w > Opour 
toutes les solutions du système Ax > b, ce qu’il fallait démontrer. 

4. Condition de compatibilité. A la différence des systèmes homogènes 
les systèmes non homogènes d’inéquations linéaires peuvent être incompa- 
tibles. Il existe différentes conditions de compatibilité de ces systèmes. Les 
conditions généralisant le théorème de Kronecker-Capelli peuvent être 
trouvées dans le livre de Tchernikov [36]. On examinera ici l’une des condi- 
tions généralisant le théorème de Fredholm. 


THÉORÈME S. Le système d’'inéquations linéaires 
Ax > b (1) 
est compatible si et seulement siuA = 0et u > 0 entraïnent ub < 0. 


DÉMONSTRATION. Supposons que le système d’inéquations (1) est compa- 
tible, c’est-à-dire qu’il existe une matrice-colonne x à n éléments pour 
laquelle Ax > b. Pour toute matrice-ligne positive u à m éléments on a 
alors uAx > ub et, par suite, u À = 0 entraîne ub < 0. 

L’assertion inverse est moins évidente. Montrons que pour un système 
incompatible de la forme (1) il existe une matrice-ligne > 0 pour laquelle 
uA = Oetub > 0. Considérons les matrices-lignes u,, ..., u, (famiue fon- 
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damentale des solutions du système d’équations A = 0) et la matrice U 
composée des lignes u,, …, u.. Il est évident que UA = O. 

Notons .” le plan dans l’espace %,, composé de toutes les matrices- 
colonnes de la forme Ax — b,xe #,. Pour tous lesye.”/ ona 


u,y = —u;,b (i = L 3:55). (7) 


Inversement, si les équations (7) sont vérifiées pour un y, la matrice- 
colonne y + b vérifie les hypothèses du théorème de Fredholm, si bien que 
le système Ax = y + b est compatible. Ainsi, le système d’équations (7) 
définit le plan .: Pour écrire ce système sous forme matricielle, introdui- 
sons la matrice-colonne g = — Ub. Alors (7) prend la forme 


Uy =q. (8) 


Le système d’inéquations (1) est incompatible si et seulement si le plan 
ne contient pas de matrices-colonnes positives ou, ce qui revient au 
même, le système (8) n’a pas de solutions positives. Dans ce cas, selon le 
corollaire du théorème 2, $ 1, le système d’inéquations 


zU2>0, zqg<0 


doit être compatible. Soit z une solution quelconque de ce système. Dési- 
gnons zU par u. Alorsu > O,uA = zUA = Oetzq = —zUb < 0, c’est- 
à-dire que ub > 0. Ainsi, la matrice-ligne y est celle qu’il nous fallait trou- 
ver. 

Cherchons quelques corollaires du théorème démontré. 


PROPOSITION 10. La matrice À étant fixée, l’ensemble des matrices- 
colonnes b pour lesquelles le système (1) est compatible, est fermé pour 
toute norme sur À, tandis que l’ensemble des matrices-colonnes b pour 
lesquelles ce système est incompatible, est ouvert. 


Il suffit de démontrer la dernière assertion car le RPM d’un 
ensemble ouvert est fermé. 

Le système (1) est incompatible s’il existe une matrice-ligne positive u 
telle que uA = 0 et ub > 0. Si une matrice-colonne b” diffère peu de b, la 
même matrice-ligne u satisfait à la condition ub° > 0, d’où l’incompatibi- 
lité du système Ax > b’. Démontrons cette assertion en majorant en 
c-norme la différence 8 = b — b. 

Si ub > 0, l'inégalité u(b + B) > 0 est vérifiée à condition que 
luBl < ub. Mais 


LuBl < max 18; D u, = viBl,, 
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OÙ » = D u.. Aussi l’écart pour lequel 


1=] 


gl, < ae 
V 


sera-t-il suffisamment petit. Notons que » # 0. En effet, les éléments de la 
matrice-ligne u sont positifs et parmi eux il y a des éléments non nuls car 
ub > 0. 


PROPOSITION 11. Le système d'inéquations linéaires Ax > b est compati- 
ble pour tout second membre b si et seulement si le système d'équations 
uA = 0 n'a qu'une solution triviale positive. 


DÉMONSTRATION. Supposons que le système 4 4 = 0 a une solution posi- 
tive u et que le système Ax > b est compatible pour tout second membre. 
Prenons pour second membre la matrice-colonne ‘u. Selon le théorème 5 
on doit alors avoir l’inégalité u'u < 0 signifiant que u = 0. 

L’assertion inverse se démontre d’une façon aussi simple. 

Dans les applications, on a souvent affaire à des systèmes d’inéquations 
de la forme (1) où on exige que les variables x’ soient positives. Cette condi- 
tion supplémentaire est évidemment équivalente à l’adjonction de n inégali- 
tés x’ > Det n’introduit en principe rien de nouveau. Cependant, il est utile 
de formuler la condition de compatibilité pour ce cas-là. 


PROPOSITION 12. Le système d’inéquations linéaires Ax > b a une solu- 
tion positivex > 0siet seulement siuA < 0etu > Oentraïnentub < 0. 


DÉMONSTRATION. Soient À une matrice déduite de À par écriture en bas 
de la matrice unité d’ordre ñn, et b une matrice-colonne déduite de b par 
adjonction en bas de 7 éléments nuls. L'existence d’une solution positive 
du système (1) est équivalente à la compatibilité du système 


Ax > b. (9) 


Pour appliquer le théorème 5, considérons d’abord les matrices-lignes de la 
forme 


u = lu,vll = lu, en” 


m ? U,, cs VU l. 


n 


Le système (9) est compatible si et seulement siuA = 0etu > Oentraînent 
ub < 0. D’une façon plus développée, cela signifie que uA + v = 0 et 
u.> 0, vu > 0 entraînent ub + v0O < 0. En éliminant de l’hypothèse la 
ligne v qui ne figure pas dans la conclusion, on obtient l’assertion exigée. 

Il existe aussi d’autres conditions de compatibilité des systèmes d’iné- 
quations linéaires non homogènes. Comme toutes celles qui ont été men- 


tionnées plus haut, elles conviennent parfaitement à des raisonnements 
0 
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théoriques, mais ne sont guère utiles à l’étude pratique des systèmes con- 
crets. 

Les paragraphes suivants seront consacrés à l’étude d’un problème de 
programmation linéaire. La première étape de sa résolution est consacrée à 
la recherche d’un point de l’ensemble polyédrique convexe (ou à l’éetablisse- 
ment du fait que cet ensemble est vide). Les programmes de résolution de 
ce problème sont accessibles, faciles à appliquer et se distinguent par un 
rendement efficace. Ils peuvent donc être utilisés avec succès à l’eétude de la 
compatibilité des systèmes d’inéquations linéaires. 

S. Inéquations résultant d’un système non homogène d’inéquations 
linéaires. Pour les systèmes non homogènes, le théorème de Farkas se pré- 
sente sous la forme suivante : l’inéquation linéaire cx > f est une consé- 
quence du système compatible d’inéquations linéaires (1) si et seulement si 
elle est une combinaison linéaire positive d’inéquations du système, ou bien 
résulte de cette combinaison linéaire quand on diminue le terme constant. 
Dans ce dernier cas, l’inéquation est appelée combinaison linéaire affaiblie. 
On démontrera ce théorème sous une forme analogue à celle du théorème 
des système homogènes (théorème 2, $ 1) en laissant au lecteur le soin de 
vérifier que cette formulation est équivalente à celle donnée plus haut. 


THÉORÈME 6. Si le système Ax > b est compatible, un et un seul des 
deux systèmes d'inéquations 


Ax >b, cx<f (10) 

el 
uA =c, u>2>0, ub>/f (11) 
à résoluble quelles que soient la matrice-ligne c à n éléments et le nombre 


DÉMONSTRATION. Supposons que le système (10) est incompatible. 
Alors, pour tout f” < f, est aussi incompatible le système 


Ax > D, —cx > —f.. (12) 


On peut appliquer le théorème 5 au système (12). Selon ce théorème, il 
existe une matrice-ligne vu = Îlu, wi à ñn + 1 éléments, telle que v > 0, 
vA — wc = Oet vb — wf > 0. 

Démontrons que w > 0. En effet, dans le cas contraire on aura 
vA = Detub > 0, d’où il résulterait que le système Ax > b est incompati- 
ble. 

Notons v' la matrice-ligne w - ! uv à n éléments. Il va de soi que 


vu >0, vA=c, vb>f.. (13) 
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Ainsi, pour tout f  < f le système (13) est compatible et il découle de la 
proposition 10 que le système (11) est compatible. 

Il nous reste à démontrer que les systèmes (10) et (11) ne peuvent pas 
simultanément être compatibles. Il est aisé de le faire. S’ils sont tous deux 
compatibles et x et u sont des solutions correspondantes, on a 


cx = uAx > ub > f, 


ce qui contredit l’inégalité cx < f. Le théorème est complètement démon- 
tré. 

Il a été déjà signalé qu’il est souvent nécessaire d’étudier des systèmes 
d’inéquations de la forme (1) où l’on exige que les variables soient positi- 
ves. Donnons l’énoncé du théorème de Farkas pour ce cas-là. 


PROPOSITION 13. De deux systèmes d'inéquations linéaires 


Ax > b, x2>0, cx</f (14) 
el 
uA <c,, u>0, ub>/f (15) 


un Système et un Seul est obligatoirement compatible. 


Comme dans le cas de la proposition 12, considérons la matrice À et la 
matrice-colonne b permettant d’écrire le système Ax > b, x > 0 sous la 
forme ÀAx > b. En appliquant le théorème 6, on constate que le système 
Ax > b, cx < f est compatible si et seulement si est incompatible le 
système 


uA +u=c, u2>0, v2>0, ub >/f, 


qu’il n’est pas difficile de réduire à la forme (15). 

Appliquons le théorème de Farkas à un cas particulier quand le système 
(1) est un système d’équations linéaires. Ecrivons ce système comme réu- 
nion des systèmes ÀAx > b et — 4x > —b et démontrons la proposition 
qui suit. 


PROPOSITION 14. L'’inéquation cx > f est une conséquence du système 
compatible d'équations linéaires Ax = b si et seulement si le système 


Ax = b 


ox > f F9 


est compatible et la matrice-ligne c est une combinaison linéaire des lignes 
de la matrice À. 


Remarquons que la formulation géométrique de cette proposition est 
assez évidente : un plan (7 — r})-dimensionnel est contenu dans le demi- 
espace donné si et seulement s’il y possède au moins un point et s’il est 
parallèle à l’hyperplan frontière de ce demi-espace. 
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DÉMONSTRATION. 1. Supposons que cx > f résulte du système Ax = b. 
Il est clair que le système (16) est compatible. En outre, selon le théorème 6, 
il existe des matrices-lignes positives u et v pour lesquelles c = 4 A — vA et 
ub — vb < f. En particulier, cela signifie que c = (u — v)A, c’est-à-dire 
que c est une combinaison linéaires des lignes de A. 

2. Supposons que c = pA'et que le système (16) est compatible. Posons 


u =p,, v=0 si p,2 0, 
et 
u = 0, Ov, = —p, Si p,<0, i=1,...,m. 


Ainsi, u > 0,u > Oetp = u — v. Pour la matrice-ligne positive lu, v, 11 
à 2m + 1 éléments, il ressort de 


lu, v, 11: Al =0 
C 


en vertu de la compatibilité du système (16) que 
— b 

lu,v,1l:| bb <O, 
J 


autrement dit, wub — vb > f. Joint à pA = uA — vA = c, u > 0, 
uv > 0, cela signifie que l’inéquation cx > f se déduit du système Ax > b, 
— Ax > —b, ce qu’il fallait démontrer. 

6. Principe des solutions frontières. On démontrera ici le théorème qui 
porte le nom de principe des solutions frontières. 


THÉORÈME 7. Supposons que le système (1) est compatible et 
Rg À = r > 1. Ilexiste alors une sous-matrice À ” composée de r lignes de 
À, telle que Rg A° = r et que A'x = b' entraîne Ax > b, où b' est la 
matrice-colonne des éléments de b qui correspondent aux lignes de À. 


Du point de vue géométrique, le théorème signifie que l’ensemble 
polyédrique convexe des solutions du système (1) admet au moins une face 
qui est un plan de dimension 7 — r. 

La démonstration consiste à choisir successivement les lignes qui for- 
ment la sous-matrice À :. 

1. Montrons que sir > 1, le système compatible de la forme (1) admet 
une solution pour laquelle l’une au moins de ses inéquations devient éga- 
lité. Soit x, la solution du système pour laquelle aucune de ses inéquations 
ne devienne égalité. Vu que r > 1, une au moins des inéquations ne se véri- 
fie pas identiquement et, par suite, il existe une matrice-colonne x, ne véri- 
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fiant pas le système. Considérons le segment joignant x, et x, : 
x, = X) + (x, — x), tef0,1]. (17) 


Un calcul simple montre que l’inéquation a,x, > b., où a; est la i-ième 
ligne de À, est équivalente à 


pour ax, — b, < Det a, = 0 pour a;x, — b, > 0. Soit 
T = min =) 2. 
i (+ & l+o 


Il est alors aisé de vérifier que x, est solution du système (1) et que 


a; X, = b;,. 
Ainsi, le système 
ax = b,, (18) 
ax >b, ïiell,m}, i+#i (19) 


l l 


est compatible. Si 7 = 1, chacune des inéquations (19) est en vertu de la 
proposition 14 une conséquence de l’équation (18), ce qui prouve le théo- 
rème. Dans le cas contraire, il existe une inéquation de numéro i, ne se véri- 
fiant pas pour une solution de l’équation (18). 

2. Supposons maintenant qu’on a choisi £ < r lignes de À de numéros 
l, ..., i,, de manière que ces lignes soient linéairement indépendantes et le 
système 


ax = b,, ieli,.…….,i] = 2, (20) 


ax > b;, JélI, (21) 


soit compatible. En vertu de la proposition 14, une au moins des inéqua- 
tions (21) ne se déduit pas de (20) et par suite, il existe un x, tel que 
a;x, = b;,ie I, et pour un j on a a,x, < b,. 

Soit x, la solution du système (20), (21). Considérons le segment défini 
par la formule (17). Vu que x, et x, vérifient (20), il en est de même de x, 
pour tout {. Par analogie à la première partie de la démonstration, on peut 
choisir 7 sur le segment [0, 1] de manière que x, soit la solution du système 
(21) pour laquelle l’une de ses inéquations devient égalité. Soit i,,, le 


numéro de cette inéquation. 
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Remarquons que pour les inéquations qui se déduisent du système 
d'équations (20) on a obligatoirement a,x, — b, > Oet, par suite, & = 0. 
Or la valeur minimale de 7 correspond au maximum de a; qui est positif. 
C’est pourquoi la ligne d n’est pas une combinaison linéaire des lignes 
a, ie I. - 

L’adjonction de l'égalité a, X = b, au système (20) et l’exclusion 
de l’inéquation correspondante de (21) permettent d’obtenir le système 
compatible de la forme (20), (21), contenant £ + 1 égalités linéairement 
indépendantes. 

Maintenant, si £ + 1 = r, le théorème est démontré. Mais si 
k + 1 < r, la procédure de choix de lignes peut être continuée, ce qui 
açhève la démonstration. 

On a vu dans la proposition 6 que l’ensemble polyédrique convexe ne 
peut avoir de faces de dimension strictement inférieure à ñ — r. D’autre 
part, on va démontrer que l’ensemble des solutions du système d’inéqua- 
tions linéaires (1) ne peut contenir de plan dont la dimension est strictement 
supérieure à ñ — r. La traduction algébrique de ce fait est la proposition 
suivante : | 


PROPOSITION 15. Supposons que toutes les inéquations du système (1) 
sont vérifiées par les solutions du système compatible d'équations linéaires 


c;x = J;, 1 = 1,5, (22) 


les matrices-lignes c,, .…., c, étant linéairement indépendantes. Alors 
s > R£ A. : 

En effet, il découle de la proposition 14 que chaque ligne de la matrice 
A est une combinaison linéaire des matrices-lignes c,, ..…, c.. Donc, 
s > Rg A = ret la dimension ñn — s du plan défini par les équations (22) 
est inférieure à 7 — r. 

Ainsi, le théorème 7 démontre l’existence d’une face plane de dimen- 
sion 7 — r ; cette dimension est minimale parmi les dimensions des faces et 
maximale parmi celles des plans contenus dans l’ensemble polyédrique. 


8 3. Eléments de programmation linéaire 


1. Introduction. Les méthodes de recherche de la plus grande (ou de la 
plus petite) valeur d’une fonction linéaire sur un ensemble polyédrique con- 
vexe sont réunies sous la dénomination commune de programmation 
linéaire. 

La programmation linéaire, comme branche autonome, est apparue à 
la fin des années 40 — début des années 50, c’est-à-dire à peu près à la 
même époque que les premiers ordinateurs, et s’est développée grâce essen- 
tiellement au perfectionnement des techniques numériques. Le besoin 
35—6442 
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d’appliquer l’appareil mathématique et les possibilités des ordinateurs à un 
large domaine de problèmes pratiques a engendré la création de modèles 
d’optimisation linéaires en économie, technique, médecine, domaine mili- 
taire, etc. 

Le mot « modèle » signifie dans ce contexte une description approchée 
de la situation réelle et du problème associé, laquelle conserve toutefois une 
ressemblance qui doit être suffisante pour les objectifs pratiques. Dans les 
modèles mathématiques, la description se fait à l’aide de l’appareil et des 
symboles mathématiques. En particulier, les modèles linéaires utilisent des 
fonctions linéaires et des systèmes d’équations ou d’inéquations linéaires. 
Les modèles d’optimisation se distinguent par le fait qu’ils impliquent la 
résolution d’un problème d’extrémum lié. 

Les principaux problèmes envisagés dans la programmation linéaire 
relèvent du domaine économique. Pour simplifier l’exposé on ne parlera 
que d’eux. Pour fixer les idées, étudions le modèle suivant appelé interpré- 
tation économique standard du problème général de programmation 
linéaire. 

On considère une entreprise qui a ñ « activités » faisant chacune inter- 
venir un certain nombre de m « biens » (par exemple, heures-ouvriers, 
machines-outils, énergie électrique, matériaux ...). On sait que pour cha- 
cune des 7 activités / 1l faut a. unités du bien ÿ. On connaît aussi la quantité 
disponible de chaque bien à : b', i = 1, .., m, et la valeur du profit tiré de 
la vente d’une unité de chacune des n activités : cj=l,...,n. Il s’agit 
d’indiquer combien d’unités de chaque activité on doit produire pour obte- 
nir le profit maximal. 

Si l’entreprise produit x/ unités se rapportant à l’activité j, j = !,...,n, 
elle dépensera 


i 
a,,X +... + 4a,x" 
unités du bien i. Cette dépense ne doit pas excéder la disponibilité b'. Ainsi, 


les limitations imposées aux biens prennent la forme d’un système d’iné- 
quations linéaires 


ax! +. +a,x" < bi, i=1,...,m. 
Le profit total engendré par toutes les activités de l’entreprise sera égal à 
px) = cxl + … + cxn. 
On doit déterminer x!, …, x" de telle sorte qu’ils vérifient le système d’iné- 
quations linéaires et maximisent la fonction +. 
Dès la création des premiers modèles d'optimisation linéaires on s’est 


aperçu que le problème de programmation linéaire correspondant pouvait 
être entièrement résolu. Ceci a entraîné une intense prolifération des 
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recherches en la matière et un aussi intense développement de la program- 
mation linéaire qui était confrontée à de nouveaux problèmes. 

La majorité des travaux consacrés à la programmation linéaire se 
fixaient pour objectif de résoudre des problèmes de dimension aussi grande 
que possible (c’est-à-dire à un plus grand nombre de variables et de con- 
traintes) et aussi rapidement que possible. L'analyse de la précision de la 
solution obtenue passait au second plan. Cette situation était due non seu- 
lement au fait qu’on remettait à plus tard la résolution des problèmes labo- 
rieux et sans rendement immédiat, mais aussi au fait que la source princi- 
pale d’erreurs dans les problèmes économiques résidait dans l’inadéquation 
du modèle, c’est-à-dire sa non-conformité à la réalité, ainsi que dans un 
mauvais recueil de l’information de départ. Même si, en s’accumulant, les 
erreurs d’arrondi pouvaient conduire à des solutions fantaisistes, elles 
n’inquiétaient pas les économistes qui les négligeaient devant toutes les 
autres erreurs. 

Somme toute, on peut dire que la programmation linéaire est devenue 
en peu de temps une partie intégrante d’une nouvelle science, l’économie 
mathématique, et une branche importante des mathématiques appliquées, 
riche en idées, acquis et liens avec ses autres branches. 

On présentera dans ce chapitre les principaux acquis de la programma- 
tion linéaire et quelques-unes de ses applications. 

2. Position du problème. Dans ce paragraphe, on suppose qu’est donne 
un système d’inéquations linéaires de la forme 


x > 0, Ax > b, (1) 
ou sous une forme plus développée 
I 
ax" +... +4a,x" > b,, 
1 
GX" ass + 4x2 0 
x! > 0,.…., x" > O0, 


et l’on recherche la solution x!, .…, x" de ce système sur laquelle la fonction 
p(x) = cxl +. + c,x" (2) 


prend une valeur minimale. 

La fonction (2) est appelée fonction économique du problème, le 
système d’inéquations (1) système de contraintes, toute solution du système 
d’inéquations (1) est dite point admissible et le point où la fonction pré- 
sente sa valeur minimale, so/ution du problème. Il faut remarquer qu’il 
existe plusieurs systèmes de termes pour décrire les problèmes de program- 
mation linéaire. 

Comme au $ 2, pour une interprétation géométrique du système d’iné- 


35° 
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quations (1) on se servira de l’espace affine. Pour le but poursuivi, on peut 
se limiter à un repère choisi une fois pour toutes, ce qui en fait transforme 
l’espace affine en espace arithmétique. On identifiera tout point à sa 
colonne de coordonnées. 

Le problème qu’on vient de formuler n’est pas un problème de forme 
générale mais il possède une propriété permettant de réduire tout problème 
de programimation linéaire à cette forme à l’aide de transformations pas 
trop compliquées. 

Premièrement, il se peut qu’il faille trouver le maximum et non pas le 
minimum de la fonction. Or il est évident que si on sait trouver le mini- 
mum, on arrivera à obtenir le maximum, car le maximum de la fonction 
#(x) est atteint au point où est atteint le minimum de la fonction —-y(x). 

Deuxièmement, le système d’inéquations linéaires (1) contient les con- 
traintes de positivité des variables. On a vu à la fin du $ 1 que tout système 
d’inéquations linéaires peut être transformé en un système à variables posi- 
tives si au lieu de chacune des variables initiales x’ on introduit deux varia- 
bles positives y’ et z' telles que x' = y! — z'. On parlera plus en détail des 
transformations du problème de programmation linéaire au point 2 du $ 4. 

Les contraintes imposées aux variables entraînent que le rang du 
système d’inéquations (1) est obligatoirement égal à n et, par suite, 
l’ensemble polyédrique convexe des points admissibles possède des som- 
mets s’il n’est évidemment pas vide. 

Le problème de programmation linéaire n’est pas obligé d’avoir une 
solution. Il peut arriver que le système de contraintes ne soit pas compati- 
ble. Même un système de contraintes compatible peut ne pas avoir de solu- 
tion si la fonction économique n’est pas minorée. Ce dernier cas n’est pos- 
sible que si l’ensemble polyédrique n’est pas borné. 

Dans ce paragraphe, on ne s’attardera pas sur les procédés de résolu- 
tions du problème et l’on étudiera ses propriétés fondamentales. 

3. Existence de solution. Avant tout, on établira les conditions sous les- 
quelles le problème 


x >0, Ax>b, cx— min (3) 
est résoluble et on décrira l’ensemble des solutions s’il n’est pas vide. 


THÉORÈME 1. Si le système des contraintes (1) est compatible et la fonc- 
tion économique est minorée, le problème (3) est résoluble. La fonction 
présente son minimum en l’un des sommets de l’ensemble polyédrique 
4 défini par le système (1) (et peut-être en d’autres points). 


Pour démontrer ce théorème, représentons un point arbitraire de 
l’ensemble, en accord avec le théorème 1 du $ 2, sous la forme 


X=u + vw. 
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Ici 


est une combinaison convexe des sommets x,, .., x, de l’ensemble & et 


M 
v= ÿB;l 
j=1 


un vecteur du cône dont la carcasse est /,, …, l,,. 

Notons avant tout que cl, > Opourtousles = 1,..., M. En effet, s’il 
existait un vecteur /, pour lequel cl, < 0, on pourrait en augmentant &,, 
les autres coefficients étant fixés, diminuer indéfiniment la valeur de la 
fonction 


p(x) = ox = B,cl, + Y Bjcl, + Ÿ a;cx,, 
jek i 
ce qui contredit l’hypothèse que & est minorée. 
Associons au point x le point x° déduit de x par substitution de zéro à 
tous les coefficients B; dans sa décomposition. Alors 


x >, 


car cx est déduit de ex par élimination de termes positifs. Notons &, le plus 
petit des nombres cx,, ..…, cx,,. On a alors l’estimation suivante : 


N N 
cx' = ÿ a;cx;, > po Ÿ à; = Pp- 
int 


im 
Ainsi, tout point admissible x vérifie l’inégalité 
cx 2 Po” 


où y, est une valeur de la fonction (x) = ex en l’un des sommets, ce qui 
achève la démonstration. 

On dira que le point x est un point intérieur à l’ensemble polyédrique 
convexe défini par le système d’inéquations (1) si x vérifie toutes les 
contraintes-inégalités du système en tant qu'inégalités strictes. 


PROPOSITION 1. Si la fonction linéaire 4$(x) n'est pas constante sur 
l’ensemble polyédrique , elle ne peut atteindre la valeur minimale en 
aucun point intérieur à cet ensemble. 


Soit p le rang du système formé à partir des contraintes-égalités du 
système (1). Selonda proposition 5 du $ 2, l’ensemble polyédrique est situé 
dans le plan (n — p)-dimensionnel 7 _ , défini par les contraintes-égalités. 
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Supposons que les inéquations sont numérotées de façon que a”-°+1, … 
.…, 47 sont les matrices-lignes des coefficients de ces contraintes. On peut 
résoudre le système d’équations | 


aix = bi, j=m-p+1,.……,m, 


par rapport à p variables. Posons que les numéros de ces variables sont 
n —p + 1,...,n. Portons ces variables dans les inéquations de numéros 
<m — Pet dans l’expression de la fonction économique. Dans ce cas, les 
contraintes-égalités restantes (linéairement dépendantes) sont vérifiées 
identiquement, tandis que les contraintes-inégalités prennent la forme 


aix > bi, 
où x = ‘xl, x". 


La restriction de la fonction économique au plan ./,_, est une fonction 

linéaire 
p(x) = cx + f 

à terme constant /. La fonction e est constante sur @si et seulement si 
la matrice-ligne de coefficients c = Îlc,, …, c,_ Î est nulle. Aussi, consi- 
dère-t-on que c # 0. 

Soit x, un point intérieur à l’ensemble polyédrique .&. Compte tenu des 
contraintes-égalités, le point x, est défini par la matrice-colonne x, compo- 


sée des ñ — p premiers éléments de la matrice-colonne x,. Considérons la 
demi-droite 


x=x — ‘ct, 


où { est un paramètre à valeurs positives. Pour tout i = 1, …,m — p, il 
vient aix, > b'et 
aix = aix, — ai('c)t. 
Si aï('c) < 0, tous les points de la demi-droite vérifient l’inéquation 
aix > bi. Mais si a'(‘c) > 0, l’inéquation a'x > 0 est vérifiée pour les 
points de la demi-droite auxquels correspondent les valeurs du paramètre 
t<t;,,où 
_ ax 
er 100) 

Il va de soi que tous les [> 0. Supposons qu’au point x correspond une 
valeur strictement positive du paramètre, inférieure à tous les s,. Ce point 


appartient à &, c’est-à-dire est un point admissible. 
En outre, pour { > 0 


ER — Et) = EX) — dt < En 
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et, par suite, le point x, n’est pas un point de minimum de c x + J, et donc 
celui de la fonction %. 

Il ressort de la proposition qu’on vient de démontrer que la valeur mini- 
male ne peut être atteinte qu’en un point d’une face .&” de l’ensemble .>. 
Or chaque face est aussi un ensemble polyédrique convexe auquel s’appli- 
que la même proposition : si la fonction n’est pas constante sur la face 
#”, la valeur minimale ne peut être atteinte qu’en un point de sa face 
Æ "". En appliquant successivement ces raisonnements aux faces de dimen- 
sions de plus en plus petites, on aboutit au théorème suivant. 


THÉORÈME 2. Les solutions du problème de programmation linéaire (3) 
remplissent une face de l'ensemble polyédrique défini par le système de 
contraintes. La solution est unique si et seulement si cette face est un som- 
met. 


En vertu des inégalités x’ > 0, le rang de la matrice du système (1) est » 
et l’ensemble polyédrique défini par le système (1) admet des sommets. Il 
en est donc de même de toute face de cet ensemble, de sorte que si le pro- 
blème est résoluble, une de ses solutions est toujours un sommet, comme 
on l’a affirmé au théorème 1. 

4. Problème dual. On peut rattacher au problème de programmation 
linéaire (3) un autre problème, appelé problème dual. I] consiste à trouver 
le maximum de la fonction linéaire 


Yu) = ub, 


définie sur l’espace des matrices-lignes à m1 éléments, à condition que 
l’argument u appartienne à un ensemble polyédrique convexe défini par les 


contraintes 
u>0, uASc. (4) 


Ainsi, le problème dual peut être écrit sous la forme suivante : 
u > 0, uA<c, ub — max. (S) 
La relation entre les problèmes (3) et (5) est une équivalence, c’est-à- 
dire que le problème dual de (5) est équivalent au problème (3). En effet, 
pour construire le dual du problème (5), ce dernier doit être réduit à la 
forme (3). Pour le faire, multiplions la matrice À, la matrice-colonne b et la 


matrice-ligne c par — 1 et écrivons g sous la forme de matrice-colonne ‘u. Il 
vient 


lu > 0, —'Alu > —!c, —'b'u — min (5') 

(la recherche du minimum de —#{(u) est équivalente à la recherche du 
maximum de ÿ(u)). Le dual de ce problème prend la forme 

y 20, y(—'A)< —'b, y(-'c) — max. (3°) 
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En remplaçant y par ‘x et en changeant les signes de —!4, —'b et —'c, on 
réduit (3°) à la forme (3). 
PROPOSITION 2. Si x et u sont des points admissibles des problèmes (3) et 
(S), il vient 
ub < cx. (6) 


De plus, si pour des points admissibles x, et u° est vérifié cx, = u°b, alors 
x, et u° sont les solutions des problèmes (3) et (5) respectivement. 


DÉMONSTRATION. Etant donné que x et u sont positifs, on a 
ub < uAx < cx. 


En outre, pour tout point admissible du problème (3), l’inégalité démon- 
trée entraîne que 


cx > u9b = CX,- 


Aussi, cx, est-elle la plus petite des valeurs de cx sur les points admissibles. 
D'une façon analogue, pour tout point admissible du problème (5), 


ub < cx, = u°b. 


Cela signifie que u°b est la plus grande des valeurs de la fonction wb sur les 
points admissibles. 
Le théorème suivant porte le nom de fhéorème de dualité. 


THÉORÈME 3. Si le problème primal (3) possède une solution x,, le pro- 
blème dual (5) possède alors une solution u°, de sorte que cx, = u°b. 

Si la fonction économique dans le problème primal n'est pas minorée, 
le système des contraintes du problème dual est incompatible. 


La démonstration se fonde sur la proposition 13 du $ 2, selon laquelle 
un et un seul des deux systèmes d’inéquations 


x>0, Ax>b, cx<f (7) 
et 
u>0, uA<c, ub>/f (8) 


est compatible. 

Le fait que la fonction cx n’est pas minorée sur l’ensemble polyédrique 
(1) signifie que le système (7) est compatible pour tout jf, et, par suite, le 
système (8) est incompatible, quel que soit f. Admettons que le problème 
(S) possède un point admissible u et posons f = ub. Dans ce cas, u est solu- 
tion du système (8) pour ce j, ce qui contredit l’hypothèse. Ainsi, le pro- 
blème (5) n’a pas de point admissible, et la seconde assertion du théorème 
est démontrée. 
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Démontrons la première assertion. Si le problème (3) a une solution x,, 
c’est-à-dire si ex, est la valeur minimale de la fonction cx sur l’ensemble 
polyédrique (1), le système (7) est incompatible pour f < ex,, et, par suite, 
le système (8) est compatible pour ces valeurs de f. Inversement, pour 
f > cx, le système (7) est compatible et par suite, (8) est incompatible. On 
en déduit que les systèmes des contraintes des deux problèmes sont compa- 
tibles. Il est de plus essentiel que pour chacun des problèmes (7) et (8) il 
existe une valeur f pour laquelle ce système est compatible. 

Partageons l’ensemble des nombres réels en deux classes Zet Ÿ° Rap- 
portons à la classe Z les nombres f pour lesquels le système (7) est compa- 
tible, et à la classe ceux pour lesquels est compatible le système (8). On a 
vu que les deux classes ne sont pas vides et chaque nombre appartient à une 
classe et une seule. Démontrons que tout nombre de la classe Z est plus 
grand que tout nombre de la classe 7. En effet, soit f” < f” et pour 
f = f”’le système (7) est compatible, tandis que pour f = f” est compati- 
ble le système (8). Or cx < ‘entraîne cx < f "et, par suite, le système (7) 
est aussi compatible pour f = f””, ce qui contredit l'hypothèse. 

Selon le principe de Dedekind, la partition réalisée définit un seul nom- 
bre f, qui est inférieur à tout nombre de la classe Z et est supérieur à tout 
nombre de la classe Ÿ. Quant au nombre /, il peut, en général, appartenir 
à l’une quelconque des deux classes. Etudions les deux possibilités. 

Soit f, e Ÿ. Dans ce cas, il existe un point u! tel que 


u1>0, ulA<c, ulb2>f. 
Siu!b > f,, alors u!'be % et il existe un point x tel que 
x>0, Ax>b, cx <ulb. 
Cela est contraire à l’inégalité (6). Donc, u!b = j,. 
D’autre part, le système (7) est incompatible pour f, et par suite, la solu- 
tion x, du problème (3) vérifie ex, > f,. Démontrons qu’on est ici obliga- 


toirement en présence d’une égalité. 
En effet, soit ex, > f,. Alors ex, e et le système 


x 20, Ax2>b, cx<cx, 


est compatible. Cela signifie que la valeur de la fonction ex, n’est pas mini- 
male. Ainsi, on a montré que 


ulb = f, = cx.. 
Considérons maintenant le cas de f,e Z. Il existe alors un point x, 
pour lequel 
x, 20, Ax, 2 b, cx, < jf. 
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La dernière inégalité montre que cx, €. Ÿ’et, par suite, il existe un point u! 
vérifiant le système d’inéquations : 


u1>0, u!'A<c, u'b > cx.. 
Selon (6) la dernière inégalité ne peut avoir lieu que si est vérifiée l’égalité 
u'b = cx,. 


Ainsi, quelle que soit la classe ou Ÿ’qui contient le nombre /,, il 
existe des points x, et u! tels que ex, = u!b. Il découle de la proposition 2 
qu’ils sont des solutions des problèmes (3) et (5) respectivement. Ensuite, il 
est évident que quelles que soient les solutions x, et u°, on a les égalités 
ex, = cx,yetulb = u°b. Il en découle que pour toutes solutions se vérifie 
l'égalité ex, = u°b, ce qui achève la démonstration du théorème. 

En vertu de la réciprocité du lien entre les systèmes duals, il ressort du 
théorème 3 que si la fonction wb n’est pas majorée sur l’ensemble polyédri- 
que (4), le système des contraintes (1) du problème (3) est incompatible. 

Il faut remarquer que la réciproque de cette assertion (et de la deuxième 
assertion du théorème 1) n’est pas vraie. L’incompatibilité du système des 
contraintes d’un des problèmes n’entraîne pas que la fonction économique 
du problème dual n’est pas bornée : les deux systèmes de contrain‘es peu- 
vent être incompatibles comme le montre l’exemple suivant. 

Le problème dual de 


x' — 2x? > 1, 


2 e 
—X*— min 
x! +2x12>0, 


x! >0, x?22>0, 


est 
u —u, < 0, 


u, — max. 
—2u, + 2u, < —1, 


On voit facilement que dans chaque problème les contraintes sont incom- 
patibles. 

Considérons un corollaire important du théorème 3. Si x, et u° sont les 
solutions des problèmes duals (3) et (5), il découle du théorème 3 que 


u®b = u°Ax,. (9) 
En effet, on a les relations u°b < u°Ax, < ex,etu°b = cx,. L'égalité (9) 
peut être mise sous la forme u°y = 0, où y = Ax, — b. 


Les éléments de la matrice-ligne u° et de la matrice-colonne y sont posi- 
tifs. Cela signifie que dans l’expression 


u0y = u9y!l + uSy? +. + uS y 


tous les termes non nuls sont strictement positifs. Donc, u°y = 0 entraîne 
que tous les termes sont égaux à zéro. 
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Soient af les éléments de la matrice À, et b' et x£ les éléments des 
matrices-colonnes b et x,. Alors, 


n 
p'= Yarxi-bl, i=1,..,m, 
kK=] 


et l’on aboutit à la proposition suivante. 


PROPOSITION 3. Six, et u ° sont solutions des problèmes duals (3) et (S) et 
si pour un numéro i E [1, m] est vérifié 


n 
i pk i 
a,x; > b', 
kK=! 
la i-ième coordonnée u° du point u° est égale à zéro. Inversement, si 
u° > 0,0ona 


Remarquons que l’annulation simultanée de u° et de y' est possible. 
_De façon analogue on peut démontrer la 


PROPOSITION 4. Pour les solutions x, et u ° du couple de problèmes duals, 
il découle de 


m 

| i 
D) uÿai <C, 
is] 


que x' = 0, et de xi > 0, que 


Supposons que les éléments de la matrice-colonne b dans (1) sont des 
variables indépendantes. Les études de ce genre sont essentielles pour la 
recherche de l’influence de variations des données du problème sur la solu- 
tion. Les variations peuvent être dues aussi bien à la modification du pro- 
blème qu’aux erreurs de mesure des données initiales. 

La matrice-colonne b n'intervient pas dans le système des contraintes 
du problème dual et les sommets u°, .…, uP de l’ensemble polyédrique des 
points admissibles de ce problème ne dépendent pas de b. Si l’on varie un 
peu b, la fonction économique modifiée du problème dual atteindra sa 
valeur maximale au même sommet #° que l’ancienne fonction. Montrons- 
le en estimant la variation possible de b. 
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Il nous faut.que pour tous i = 1, ..., p soit vérifiée l’inégalité 
u%(b + Ab) > ui(b + Ab), 
ou bien 
(u9 — u')b > (ui — u°)Ab. 


Le premier membre est ici positif vu que u° est la solution du problème pri- 
mal. En vertu de l’inégalité de Cauchi on a (ui — u°)Ab < lui — u0H x 
x IAbÏ. Aussi l’inégalité exigée se vérifiera-t-elle pour tous les à si 


O — pi 
IABI & min #7 4)b 


————— . 10 
i Nu — u'l (29) 


Il s'ensuit la 


PROPOSITION 5. Si la variation de la matrice-colonne b ne dépasse pas le 
second membre de la formule (10), la solution u°® du problème dual (5) 
demeure inchangée. 


En vertu de la dualité, il en découle l’invariance de la solution du pro- 
blème (3) pour de petits changements des coefficients c de la fonction éco- 
nomique %. 

Servons-nous de la proposition 5 pour obtenir la propriété suivante de 
la solution du problème dual. 

La valeur minimale cx, de la fonction ex du problème (3) dépend natu- 
rellement de b car l’ensemble de points sur lequel est recherché le minimum 
varie avec b. De plus, on connaît la forme de cette dépendance : 


_ 10 
é CX, = u°b. 


On ne peut pas dire que cette dépendance est linéaire car pour une 
importante variation de b la matrice-ligne #° ne reste plus inchangée. Mais 
dans un voisinage de la matrice-colonne b (sauf un nombre fini de ces 
matrices-colonnes) la fonction est linéaire. Indiquons que l’analogue unidi- 
mensionnel de cette fonction est la fonction dont la courbe représentative 
est une ligne brisée. | 

Ceci pris en compte, on peut affirmer que 


d(cx.) 
Si u; (11) 


en des points où ces dérivées partielles existent. 

Supposons qu’une composante u° de la solution u° du problème dual 
est nulle. L'égalité u° = 0 demeure vraie après la substitution à la matrice- 
colonne b de la matrice-colonne voisine b”. Donc, la dérivée partielle de cx, 
par rapport à b' vaut zéro dans un voisinage de la valeur initiale b’. Ainsi, 
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l'égalité u9 = 0 signifie que ex, ne varie pas pour de petites modifications 
de b!. 

D'autre part, selon la proposition 3, u°s’annule si la solution X, du pro- 
blème primal (3) vérifie la ;-ième contrainte en tant qu’inégalité stricte. On 
a ainsi obtenu la 


PROPOSITION 6. La valeur minimale de la fonction 4 ne varie pas pour de 
petites modifications du i-ième élément de la matrice-colonne des seconds 
membres si et seulement si est nulle la i-ième composante de la solution du 
problème dual. Il suffit pour cela que la i-ième contrainte se vérifie pour x, 
comme inégalité stricte. 

S. Fonction de Lagrange. Une autre interprétation de la solution du 
problème dual est liée à la fonction 


L(x,u) = cx + u(b — Ax) (12) 


composée pour le problème (3). u est ici la matrice-ligne à m éléments, si 
bien que Z(x, u) est une fonction de m + n variables. On l’appelle fonc- 
tion de Lagrange. En regroupant les termes, on peut la représenter sous la 
forme 


L(x,u) = ub + (c — uA)x, (13) 
d’où l’on voit que pour le couple de problèmes duals la fonction de 
Lagrange est la même. 


PROPOSITION 7. Soient x, et u° les solutions des problèmes duals (3) et 


(5). Alors le point (x,, u°) de À "+" est le point-selle de la fonction de 
Lagrange, c'est-à-dire que tous x > Oetu > 0 vérifient la double inégalité 


Lx, u) < L(xyu°) < L(x, u°). (14) 
DEMONSTRATION. Pour tout u positif, Ax, > bentraîneu(b — Ax,) < 
< 0. Or, en vertu de l’égalité (9), u°(b — Ax,) = 0. Donc, 
cx, + u(b — Ax,) < ex, + u°(b — Ax,), 
et la première inégalité (14) est démontrée. La seconde inégalité se démon- 
tre de façon analogue si on utilise l’expression (13) et la proposition 4. De 
la démonstration donnée il ressort que 
L(x,, 4°) = cx, = u°b. 


La fonction de Lagrange est étudiée en analyse mathématique (voir 
Koudriavtsev [21], t. II, p. 96) où elle est construite pour obtenir l’extré- 
mum lié de la fonction f(x), avec contraintes de la forme #,(x) = 0, 
i = 1,.., m, et prend la forrce ” 

L(x, À) = f(x) + Y Xp, (x). 
is] 


Les variables À,, .…, À, sont dénommées facteurs de Lagrange. 
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Dans le cas considéré, les contraintes sont des inéquations et les varia- 
bles sont obligées d’être positives. Le théorème eétendant la méthode de 
Lagrange aux problèmes avec contraintes plus générales est appelé fhéo- 
rème de Kuhn-Tucker. On peut le trouver par exemple dans le livre de Kar- 
manov [18]. 

La proposition 7 qu’on vient de démontrer est le théorème de Kuhn- 
Tucker pour le cas d’une fonction linéaire avec contraintes de la forme (1). 
On voit que les variables du problème dual jouent le rôle de facteurs de 
Lagrange par rapport au problème primal. 


$S 4. Méthode du simplexe 


1. Introduction. Dans ce paragraphe on fera connaissance avec la 
méthode du simplexe. C’est la méthode principale parmi toutes les métho- 
des finies de résolution des problèmes de programmation linéaire, c’est-à- 
dire les méthodes qui fournissent en principe un résultat exact en un nom- 
bre fini d’opérations. C’est précisément l’efficacité de la méthode du sim- 
plexe qui assura à la programmation linéaire une grande popularité. 

L'idée principale de la méthode du simplexe est assez évidente. Selon le 
théorème 1 du $ 3, le minimum de la fonction économique # est atteint en 
l’un des sommets de l’ensemble polyédrique défini par le système des con- 
traintes. D’un sommet à l’autre on peut passer suivant l’arête. Ceci étant, 
les valeurs de la fonction économique # diminuent si la projection de son 
gradient sur l’arête (autrement dit, la dérivée de & dans la direction de 
l’arête) est strictement négative. Supposons qu’on a trouvé un sommet 
d’où il part une arête telle que la projection sur elle du gradient soit stricte- 
ment négative. Il y a deux possibilités à considérer : 

a) L’arête est un segment. Dans ce cas, la seconde extrémité du segment 
est un sommet où & prend une valeur plus petite qu’au sommet de départ. 

b) L'’arête est une demi-droite. Il existe alors sur l’arête des points où # 
prend des valeurs aussi petites que l’on veut, de sorte que le problème est 

-irrésoluble car la fonction n’est pas minorée. 

Admettons que le problème a une solution. Vu qu’après le passage de 
chaque arête la valeur de & diminue, on ne peut revenir au sommet déjà 
dépassé. Le nombre de sommets étant fini, on doit aboutir en un nombre 
fini d'étapes à un sommet où est atteint le minimum. Ce sommet se caracté- 
rise par le fait que les projections du gradient sur toutes les arêtes issues de 
ce sommet sont positives. 

L'avantage important de la méthode du simplexe est que tous les calculs 
nécessaires à la réalisation du schéma décrit se réalisent facilement au cours 
de transformation d’une matrice suivant l’algorithme proche de la méthode 
de Gauss. 
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Des autres méthodes de programmation linéaires il convient de men- 
tionner les méthodes itératives qui, ces derniers temps, se perfectionnent 
intensément et sont de plus en plus utilisées. Faute de place on ne s’arrêtera 
pas sur ces méthodes. 

2. Forme canonique du problème. La méthode du simplexe est appli- 
quée aux problèmes de forme dite canonique. Plus précisément, le système 
des contraintes doit être de la forme 


dix ts Fax =D}, 
ne die 00 Oo x! > 0,...,x" > O. (1) 


On suppose que dans ce cas les seconds membres sont positifs, 
b' >0,..,b" > O0, 


et les lignes de coefficients, linéairement indépendantes. De la dernière 
hypothèse il résulte en particulier que m < n. 

Le système (1) contient m7 contraintes-égalités indépendantes et 7 inéga- 
lités (également indépendantes) de la forme x’ > 0. Ainsi donc, si le 
système est compatible, il définit un ensemble polyédrique convexe de 
dimension < n — m, qui possède des sommets. 

D'une façon générale, le problème posé peut ne pas présenter de forme 
canonique, et la méthode du simplexe ne peut alors être appliquée directe- 
ment. Toutefois, en augmentant le nombre de variables, on peut réduire 
tout problème à un problème équivalent de forme canonique. L’équiva- 
lence est ici comprise au sens que d’après la solution du problème canoni- 
que on peut indiquer la solution du problème initial. 


PROPOSITION 1. Tout problème de programmation linéaire peut être 
réduit au problème de forme canonique. 


DÉMONSTRATION. Posons que le système des contraintes du problème ini- 
tial est de la forme 


Re (2) 


Transformons d’abord les inéquations en équations : 
ax! +... +a x" yl= bi, i=1,...,m, 


où y’ sont des variables positives. (Si le système (2) contient l’inégalité de la 
forme x/ > 0, il n’est évidemment pas nécessaire de la réduire à 
xi — yi = 0, y > 0.) Muiltiplions ensuite par —1 chacune des égalités 
dont le second membre est négatif. 
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Dans le système obtenu, introduisons, au lieu de chacune des variables 
x} non assujetties à la condition x/ > 0, deux nouvelles variables positives 
liées à celle-ci par l’égalité 
xi = zi — 7" +j. 


Maintenant, si l’on élimine les équations linéairement dépendantes, le 
système obtenu ne diffère du système (1) que par les notations des coeffi- 
cients et des variables. 

Pour simplifier l’écriture, posons que dans le système initial il n’y avait 
pas d’inéquations de la forme x/ > O0 et qu’on a joint m variables supplé- 
mentaires }'. Soit ‘lx!, ..., x"1l un point admissible du système initial. 
Posons z/ = x, z"*i = O0 si x/ > 0, et z/ = 0, z"+{ = —xi si x < 0. 
Désignons les différences 


(a,,x! + … + a,x") — b' 


par y’. Alors ‘Nz!,..….,z27,yl, ...,y"Il est un point admissible du problème 
canonique. Inversement, d’après le point admissible du problème canoni- 
que il est aisé de construire le point admissible du problème initial. Aussi 
les systèmes de contraintes des deux problèmes sont-ils compatibles ou 
incompatibles simultanément. 

Pour la fonction économique w(x) = c,x! + .…… + c,x” du problème 
initial définissons la fonction correspondante du problème canonique : 


pG)= cz +. + cz — cat. — c,,227 + Opl + … + Op. 
Si au point z = ‘Iz!,...,z27, yl, ..., y" est associé le point 
x = P(z) _ tUz! — gti, …., Z' _ zh, 


il est évident que (2) = y(x). 

Les ensembles de valeurs des deux fonctions coïncident et y(x) est 
minorée si et seulement s’il en est de même de w(2). Si #(z) présente son 
minimum au point z,, la fonction #(x) prend au point x, = P(z,) la même 
valeur qui est aussi minimale. La proposition est démontrée. 

Il convient de noter qu’en recherchant une démonstration simple et 
générale on ne lésinait pas sur les variables supplémentaires. Il existe 
d’autres procédés de réduction du problème à la forme canonique sans que 
le nombre de variables augmente si fortement ; il y en a même d’autres où 
ce nombre diminue. En voici un exemple. 

Posons que le système (2) a une matrice de coefficients de rang ñ et que 
les 7 premières inéquations possèdent des seconds membres linéairement 
indépendants. Introduisons les nouvelles variables 


pi = a;,xX! 0 a X" — b, j = 1,...,n. 


Dans ce cas, les 7 premières inéquations prennent la forme y! > 0, … 


…, }" > 0. Dans les autres inéquations, remplaçons x}, ., x” par leurs 
expressions en nouvelles variables, puis transformons-les en équations 
linéairement indépendantes avec seconds membres positifs comme on l’a 
fait dans la démonstration de la proposition 1. 

Il existe d’autres procédés de transformation des contraintes, mais la 
méthode utilisée dans la démonstration a pris une grande extension vu sa 
simplicité. 

On supposera dans la suite de ce paragraphe qu’on a à résoudre le pro- 
blème canonique de programmation linéaire . 


Ax = bb, x2>0, cx— min (3) 
sous les hypothèses 
RA=m, b2>t0. 
3. Dual du problème canonique. Pour définir le dual du problème (3), 
on mettra (3) sous la forme 
x 20, Px2>gq, cx— min, 


où la matrice P et la matrice-colonne g ont la structure en blocs suivante : 


A PURE PI 


Le problème dual s’écrit alors selon (5) du $ 2 sous la forme 
P< ce, y > 0, yb — max, 


où y est une matrice-ligne à 2n éléments qu’on écrira comme réunion de 
deux matrices-lignes y! et y? à n éléments chacune : y = ly!, y2. Ceci 
permet d’écrire le problème dual sous une forme plus développée : 


(y! —- py)A <c, y >0, (y! — y?)b — max. 


Outre la condition de positivité, les matrices-lignes y! et y? n’y figurent 
que sous la forme de la différence y! — y? qu’on notera u. La matrice- 
ligne u ne doit pas nécessairement être positive. Si Ay!, y2l vérifie le 
système des contraintes, u vérifie le système uA < c. 

Inversement, si pour une matrice-ligne # on a uA < c, il est aisé de 
construire une matrice-ligne y à 2n éléments, telle que yP < c et y > 0. 
Par conséquent, le dual du problème canonique (3) se réduit au problème 


uA <C, ub — max, (4) 


qu’on appellera problème dual de (3). 

Le problème (4) n’est pas canonique. On lui donnera une forme plus 
proche de la forme canonique si l’on introduit # variables positives z!, 
.…, 2" écrites en matrice-colonne z et l’on transforme les contraintes de ce 
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problème en égalités 
(Alu + z ='c, ‘b'u — max. (5) 


Vu que les variables # ne sont pas obligées d’être positives, il n’y a aucune 
raison d’exiger la positivité des seconds membres. 

4. Sommets et arêtes du polyèdre d’un problème canonique. Les som- 
mets d’un ensemble polyédrique défini par le système d’inéquations linéai- 
res sont déterminés par transformation en égalités exactes de 7 inéquations 
indépendantes quelconques du système. Le système (1) comprend m7 égali- 
t 

- aix! +. + alx" = bi, 


I Le (6) 


Par conséquent, en chaque sommet, on doit remplacer par des égalités au 
moins n — minégalités x! > 0,...,x" > 0. Cela signifie que chaque som- 
met possède au moins 7 — m coordonnées nulles. 

Les sommets possédant plus de 7 — m coordonnées nulles sont dits 
dégénérés. Si un tel sommet existe, l’ensemble polyédrique et le problème 
sont dits dégénérés. 

Un exemple d’ensemble polyédrique dégénéré nous est fourni par le seg- 
ment défini par le système d’inéquations 


x! +x2+ x = 1, 


x! + :* + 2x? = 1, 
x > 0. 
L’extrémité N (1, 0, 0) de ce segment est un sommet dégénéré (fig. 56). 


Un exemple d’ensemble polyédrique non dégénéré est donné par le 
système d’inéquations 
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xl + x? + x° = 


| 
Ce 2 
* 


x + 2x2 + 2x3 = 1, 


| x > 0, 
qui définit le segment MN sur la figure 57. La comparaison de ces exemples 


montre que le dégénérescence est la propriété non pas de l’ensemble polyé- 
drique mais du système d’inéquations qui le définit. 


Fig. 57. 


PROPOSITION 2. Pour chaque sommet d’un ensemble polyédrique con- 
vexe défini par le système (1) il existe m colonnes linéairement indépendan- 
tes de la matrice À, dont toutes les colonnes correspondant aux coordon- 
nées strictement positives du sommet considéré. 


DÉMONSTRATION. Supposons pour simplifier les notations que les 7 — m 
dernières coordonnées du sommet donné sont nulles et considérons la 
matrice d’ordre ñ : 


A 
OÏIE 
où À est la matrice du système (1) et E la matrice unité d'ordre ñn — m. La 
matrice U est composée des lignes correspondant aux inéquations qui se 
transforment en équations pour le sommet considéré. Par hypothèse, ces 
inéquations sont linéairement indépendantes et, par suite, le déterminant 
de la matrice n’est pas nul. Il en découle qu’est différent de zéro le mineur 
d’ordre m de la matrice À, contenu dans ses "7 premières colonnes, ce qui 
achève la démonstration. 

Les colonnes dont il s’agit dans la proposition 2 sont des colonnes du 
mineur principal de la matrice 4. En programmation linéaire, les m colon- 
nes linéairement indépendantes de la matrice À sont tout simplement appe- 
lées base. Les coordonnées du sommet associées aux colonnes d’une base 
sont dites de base. 
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La correspondance entre les bases et les sommets peut être décrite par 
les propositions suivantes : 

a) A chaque sommet est associée au moins une base. Si le sommet est 
dégénéré (et seulement dans ce cas-là), on peut lui faire correspondre plus 
d’une base. ; 

b) Un sommet n’est pas obligatoirement associé à une base. Si l’on sup- 
pose que les variables secondaires sont égales à zéro et que l’on obtienne les 
variables de base à partir du système, la matrice-colonne x/ à m éléments, 
composée de ces variables, est égale à 4; ! b, où À, est une sous-matrice de 
la matrice À, composée des colonnes de la base. Donc, à une base corres- 
pond un sommet si 


x! = A;lb2>0, 


et seulement dans ce cas-là. La base à laquelle correspond un sommet est 
dite admissible. 

L'existence des problèmes dégénérés entraîne d’importantes difficultés 
en théorie de la méthode du simplexe. Dans les calculs suivant la méthode 
du simplexe, on doit donc prendre des mesures spéciales sans lesquelles 
l'algorithme peut s’avérer non efficace au cas d’un problème dégénéré. 

On supposera dans la suite que le problème est non dégénéré, en repor- 
tant la discussion des problèmes dégénérés au point 8. 

Une arête du polyèdre issue du sommet x, peut être définie par l’équa- 
tion paramétrique 


x =x, + dl, (7) 


où l'est un vecteur directeur et { un paramètre positif. Si l’arête est un seg- 
ment, / € [0, 7], si elle est une demi-droite, te [0, + of. 

Vu que pour tous les points du polyèdre on a les égalités Ax = b, le 
vecteur directeur de l’arête satisfait à la condition 


Al = 0. (8) 


Etant une face unidimensionnelle du polyèdre, l’arête se définit par un 
sous-système du système (1) dans lequel 7 — 1 inéquations sont remplacées 
par les équations. Il s’ensuit que tous les points de l’arête ont les mêmes 
n — m — 1 coordonnées nulles. Soit 7 = {i,, .…, t,, ] l’ensemble des numé- 
ros de colonnes d’une base correspondant au sommet x,. Etant donné que 
le problème est supposé non dégénéré, cette base est définie parfaitement et 
x > 0 pour tous les j € I. 

Pour cette raison, chacune des coordonnées x’, i e Z, plus encore une 
coordonnée dont le numéro sera noté K, des points de l’arête peuvent diffé- 
rer de zéro. Les autres coordonnées sont a priori nulles et, par suite, 


B=0, jél, j+k. (9) 
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Compte tenu de ces égalités dans la formule (8), il vient 
Al! + a,lf = 0, 


où À, est la matrice composée de colonnes de la matrice 4, dont les numé- 
ros appartiennent à Z, et // la matrice-colonne à m éléments, composée des 
coordonnées /', ie I. D'où 


= —IKAFla,. (10) 


Par substitution des valeurs (9) dans l’équation paramétrique (7) on 
obtient 


x! = xl + Ur, 
x* = IKt, (11) 
x = 0, jél, j#k. 


On peut maintenant déterminer si l’arête est une demi-droite ou un seg- 
ment et à quoi est égale dans ce dernier cas la valeur de ? correspondant à la 
seconde extrémité du segment. Remarquons tout d’abord que 


IK > 0. (12) 


En effet, pour /* < 0 on aurait x* < 0 pour tous les { > 0, ce qui est 
impossible, et pour /* = O0, selon (10), on aurait / = 0. A proprement par- 
ler, la condition /* > 0 fixe la direction du vecteur /, défini par les formu- 
les (9) et (10) au facteur près, de manière que ce vecteur soit dirigé le long 
de l’arête vers le deuxième sommet (si l’arête est un segment) ou suivant la 
demi-droite (si l’arête est une demi-droite). 

Pour [! > 0, il est évident que la formule (11) définit pour tous les 
t > O une solution positive du système (6). Ceci revient à dire que l’arête 
considérée est une demi-droite. 

Admettons que parmi les éléments de la matrice-colonne [/ il y a des élé- 
ments strictement négatifs. Notons 7 l’ensemble des ; pour lesquels 
l < 0. Considérons la demi-droite définie par les formules (11) pour 
t > 0. Les coordonnées x’, ie 1, du point courant de cette demi-droite 
changent de signe, chacune pour sa valeur de f. La coordonnée de numéro s 
pour lequel le quotient —xf/l', ie 17, est minimal changera son signe la 
première. Elle s’annulera pour la valeur de f égale à 


l' IS 


C’est justement la valeur du paramètre correspondant au deuxième som- 
met x, sur l’arête étudiée. Pour ce sommet on ax = Oetx* > 0. Aussi, la 
base associée au sommet x, s’obtient-elle à partir de la base du sommet x, 
par substitution de la colonne de numéro & à la colonne de numéro s. S'il 


T = min [| -- 5 (13) 
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arrive que le minimum (13) est atteint pour au moins deux valeurs i = s,, 
S,, on peut associer deux bases au sommet x, qui est alors dégénéré. On 
suppose qu’il n’en est pas ainsi. 

Remarquons que dans toutes les discussions précédentes le numéro 
était arbitraire non compris dans /. Par suite, il part 7 — m arêtes d’un 
sommet arbitraire non dégénéré. 

On sait que pour une fonction # de n variables la dérivée dans la direc- 
tion définie par le vecteur / est la projection du gradient 


dp 0 


rad © = |——, …, 
SE ax! ax" 


sur cette direction, c’est-à-dire 


Le 3x” ee 


si le vecteur / est normé de manière que la somme des carrés de ses compo- 
santes soit égale à 1. La fonction #(x) décroït dans la direction de / si 
l’expression (14) est strictement négative. Le signe de cette expression est 
indépendant de la norme de L. 

On considère une fonction linéaire g(x) = c,x' + .… + c,x” dont le 
gradient est constant : 


grad # = Îc,,…,c,l 


et sa projection sur l’arête en chaque point de cette dernière est la même. 
Selon (9) et (10) on a 


y cdi = cl + clé = IK(c, — c,Aïla,), 


im] 


où c, et [/ sont les matrices-ligne et -colonne formées des composantes de c 
et / dont les numéros appartiennent à Z. Vu que /* > O, le signe de la pro- 
jection du gradient sur l’arête considérée coïncide avec le signe du nombre 


A, =c, —c;A;la,. (15) 


Il est naturel que les nombres À, , £ é JZ, jouent un rôle important dans la 
méthode du simplexe. On les appelle estimations de substitution correspon- 
dant à la base définie par l’ensemble de numéros J. 

S. Etape de la méthode du simplexe. Il est maintenant clair quels sont 
les calculs à faire pour passer d’un sommet du polyèdre au sommet voisin 
et diminuer par là même la valeur de la fonction économique. Soit un som- 
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met de départ défini par l’ensemble 7 de numéros des colonnes de la base 
qui lui est associée. 

Ce qu’on doit faire en premier lieu, c’est de calculer les estimations de 
substitution (15) pour tous les k é J. Si elles sont toutes positives, le som- 
met considéré est solution du problème, et il ne nous reste qu’à calculer ses 
coordonnées non nulles suivant la formule 


x! = A r'b (16) 
et la valeur de la fonction 
px) = c,x! 


pour obtenir la réponse. 

Si parmi les estimations de substitution il y en a des strictement négati- 
ves, on recherche la maximale en module parmi ces dernières, en notant k 
son numéro. La matrice-colonne de numéro # sera introduite dans la base. 

Ensuite, on recherche la matrice-colonne 


[= —-A;Fla, (10°) 


(la norme du vecteur directeur de l’arête est telle que /* = 1). Si tous les 
éléments de cette colonne sont positifs, le problème n’a pas de solution car 
la fonction économique n’est pas minorée. 

Si parmi les éléments de la matrice-colonne //il y en a des strictement 
négatifs, on cherche le quotient minimal (13) et le numéros € 7 pour lequel 
ce quotient est minimal. La colonne de numéro s doit être exclue de la base. 
On a ainsi défini un nouvel ensemble 7” comprenant les numéros des colon- 
nes de la base associée au nouveau sommet, et l’étape de la méthode du 
simplexe s’achève. 

La principale difficulté dans ces calculs est la recherche de la matrice 
A; ! (si, évidemment, les dimensions de la matrice ne sont pas si grandes 
que, par exemple, un simple dénombrement entrepris pour choisir le rap- 
port minimal (13) s’avère difficile). On peut remarquer qu’en réalité on a 
besoin non pas de la matrice A,-! mais des produits c,A;!, A; 1b, 
— A; la, qui peuvent-être obtenus par résolution du système d’équations 
linéaires y4, = c,, A,x! = bet A,l! + a, = 0. Pour les résoudre, il suffit 
d’obtenir une seule fois la LU-décomposition de la matrice À,. Une telle 
approche est mise en œuvre par exemple dans le programme contenu dans 
le livre de Wilkinson et Reinsch [43]. 

Les calculs de la methode du simplexe peuvent se baser sur des transfor- 
mations élémentaires effectuées sur les lignes de la matrice 


A Db 
EE A | 
C 0 
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ou sous forme plus développée 


ai a! b! 
ER Doc 
a ar br" 
C; . C 0 


Cette matrice (aussi bien sous forme initiale qu'après transformations) est 
appelée tableau du simplexe. Si on connaît l’ensemble des indices de la base 
de départ Z, on arrive, par des opérations élémentaires sur les lignes de la 
matrice 7, à transformer ses colonnes de numéros ie Z pour qu’elles 
deviennent les premières colonnes de la matrice unité d’ordre m + 1. On 
voit aisément que ces transformations sont équivalentes à la multiplication 
à gauche par la matrice 


A7! _] 
v=| 55 |- US 
—C;À . 


Notons À, la sous-matrice de la matrice À, constituée des colonnes 
n DDatenabe pas à la base, et c, la matrice-ligne des coefficients c; pour 
lesquels ; é Z. Si pour plus de clarté on admet que les colonnes de base se 
trouvent aux premières places, on peut écrire 


A5: ‘| fr A, TE FF A; 'A, Ar \b 
—c, A! 0 c,-c,A;'A, —-c,A;'bl 


Il s’avère évident que la matrice VT contient toute l’information néces- 
saire. Remarquons que l’élément droit inférieur de cette matrice ne diffère 
que par le signe de la valeur de la fonction économique dans le sommet 
considéré. 

L’avantage important de ce procédé réside dans le fait qu’il n’est pas 
nécessaire de transformer la matrice 7 avec le passage au sommet suivant : 
il suffit de prendre VT pour matrice de départ et procéder à sa transforma- 
tion. En effet, le système des contraintes du problème à matrice VT est 
équivalent à celui du problème de départ ; quant à la fonction économique, 
elle est obtenue de la fonction initiale $ par adjonction d’une expression 
identiquement nulle sur l’ensemble polyédrique défini par les contraintes. 

La circonstance notée facilite de façon importante les calculs car une 
seule colonne de la base change en une étape et il faut appliquer à la matrice 
VT les seules transformations élémentaires qui correspondent à la colonne 
introduite dans la base. 

Le défaut de la méthode fondée sur la transformation du tableau réside 
dans le fait qu’on est obligé au cours de la transformation de calculer tous 


r-| 
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les produits 4; a, j é I, tandis qu’on n’en a pas directement besoin. En 
effet, on n’a pas besoin de 4; 14,. Sont exigés (cA4;!)A,et A; la, pour 
la matrice-colonne a, introduite dans la base. 

Pour augmenter le rendement des calculs de la méthode du simplexe on 
peut procéder à la transformation de la matrice 4; ! une fois trouvée en la 
matrice À ;! correspondant au sommet suivant. Ce n’est pas compliqué, vu 
que À,. se déduit de À, par modification d’une seule colonne. On peut se 
servir ici de la forme d'élimination de la matrice inverse, utilisée non seule- 
ment dans la méthode du simplexe mais aussi dans différentes méthodes 
numériques d’algèbre linéaire. 

6. Méthode d’élimination de Ia matrice inverse. Il nous faut nous rappe- 
ler comment on a obtenu la ZU-décomposition par la méthode de Gauss, 
exposée au $ 3 du ch. XIII. Soit B une matrice carrée régulière dont les 
lignes et colonnes sont ordonnées de manière que les mineurs principaux de 
B soient différents de zéro. A la page 402, on a introduit les matrices S, tel- 
les que 


BW = S,BK-1), k = 0,...,n, 


où B° = B, B!,..., Bt") = Uest une suite de matrices déduites de B par la 
méthode de Gauss. Chaque matrice S, ne diffère de la matrice unité que 
par une colonne et peut être écrite sous la forme 


S,=E+(e,-e,)'e,, 


où e, est une colonne de la matrice unité et les éléments de la colonne e, 
s'expriment au moyen d’éléments de B(*-D suivant les formules 


oo =0i<k, 
(DS 0), 
—bH-D/DÉ-D I > RK. 


Pour mémoriser S,, il suffit d’écrire les éléments de la colonne se, de 
numéros i > k, vu que le produit de S$, par une matrice-colonne arbitraire 
£ peut être trouvé facilement à l’aide de ces seuls éléments. En effet, 


S, £ = £ + (o, 7 e,)'e,£ = £ + (o, bé e,)E. 


De façon analogue on peut obtenir le produit d’une matrice-ligne arbitraire 
par S, . 

On peut effectuer la suite d’opérations de substitution inverse dans le 
schéma de division unique en multipliant U par les matrices T;, j=n,.… 
…, 2. Pour i > j, l'élément ,; de la matrice U vaut b{). Aussi les j — 1 
opérations élémentaires qui transforment la j-ième colonne de U en la 
j-ième colonne de la matrice unité sont-elles équivalentes à la multiplication 


k 
Tk 


i 
Ok 
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de U par la matrice 
> { 
où T; est une matrice-colonne d’éléments 
a î) . . 
ri = f D Ii, 
4 0, i < j. 
(Rappelons que les éléments diagonaux de U sont égaux à l’unité.) De 


même que pour les matrices S,, le produit T;£ peut être calculé d’après les 
éléments de 7; à l’aide d’un nombre peu élevé d'opérations arithmétiques : 


TE = E + Er. 


Après multiplication par 7 — 1 matrices la matrice U devient une 
matrice unité 


Cela veut dire que 


ou 
BP=T TS 5: 


Cette décomposition de B-! en facteurs est appelée forme d'élimination de 
la matrice inverse. Cette décomposition contient 7 matrices triangulaires 
inférieures S, et ñ — 1 matrices triangulaires supérieures 7:. Le lecteur 
peut trouver des renseignements plus détaillés sur la forme d’élimination et 
autres formes de représentation de la matrice inverse dans le livre de 
Twearson [37]. 

La forme d’élimination est particulièrement commode pour le traite- 
ment de grandes matrices creuses. Ces matrices se rencontrent souvent dans 
les problèmes de programmation linéaire. 

Voyons comment se modifie la forme d’élimination de la matrice B7! si 
on remplace dans B la j-ième colonne par la matrice-colonne b;. Désignons 
par B la matrice résultant de cette substitution. En effectuant les opérations 
élémentaires sur les lignes, on voit que chaque colonne se transforme indé- 
pendamment des autres. Aussi les matrices 


HT ETS, 88 
et 
H=T,.;..T,S, … SB 


ne diffèrent-elles l’une de l’autre que par la j-ième colonne. Soient a, 
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i = 1,...,n, les éléments de la j-ième colonne de H. Pour la transformer en 
colonne e; il faut multiplier H par la matrice 


. De 
T; = E + 7;('e;), (17) 
où 7; est la matrice-colonne d’éléments 


7 pe 

don fe ro. (18) 
—æ@'/x), i%)J. 

(En décomposant det FH suivant les dernières colonnes, on vérifie facile- 

ment que æ«/ # 0.) 

Les matrices TH et TH sont égales et, par suite, se réduisent à la 
matrice unité par multiplication par une même suite de matrices 
T, .… T;_,. On voit que la forme d'élimination de B-" se déduit de celle de 
B7! par substitution de T, à T,;, où T, se définit par les formules (17) et 
(18), avec 


@ = ]. 


PAR TS, … S,b;. 

Dans la littérature sur la programmation linéaire on trouve la descrip- 
tion d’un grand nombre d’autres procédés de calcul de la matrice inverse 
lors du changement de base, mais on se limitera à cet exemple suffisam- 
ment simple et caractéristique. 

7. Recherche de la base de départ. On connaît déjà beaucoup sur la 
méthode du simplexe mais on est incapable de l’appliquer car on ne peut 
trouver de sommet à partir duquel on puisse débuter. En effet, en choisis- 
sant une base arbitraire, on ne peut être sûr que les variables de base obte- 
nues par la formule (16) seront positives. 

Si la base de départ est inconnue d’avance, le problème de son choix est 
résolu grâce à l’augmentation du nombre de variables. On dit que la varia- 
ble est isolée dans une équation si elle y figure avec un coefficient stricte- 
ment positif et n’intervient dans aucune autre équation. On peut immédia- 
tement indiquer la base de départ si chacune des équations du système (6) 
contient une variable qui y est isolée. Plus précisément, on peut considérer 
que la base de départ est formée des colonnes correspondant à ces varia- 
bles. 

Les variables isolées peuvent par exemple apparaître lorsqu’on trans- 
forme les inéquations en des équations. Ceci étant, il peut aussi surgir une 
variable qui intervient dans cette équation avec le coefficient — 1. 

Le procédé de construction de la base de départ consiste à introduire 
des variables isolées spéciales, dites artificielles, dans toutes les équations 
ne renfermant pas de variables isolées. 

Si l’on introduit p variables artificielles, on passe de l’ensemble polyé- 
drique convexe . de l’espace , à l’ensemble polyédrique convexe æ de 
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l’espace #,,,. L'ensemble Æ contient obligatoirement au moins un 
point. En fait, il renferme même un sommet, car pour le système de con- 
traintes qui le définit il existe une base admissible. 

Pour trouver le sommet de l’ensemble polyédrique &° (ou nous con- 
vaincre qu’il est vide), considérons le soi-disant M-problème : trouver sur 
l’ensemble polyédrique le minimum de la fonction 


vx, xt) = (xl, ., x) + Mxtl +... + x+P), 


où le deuxième terme représente le produit de la somme des variables artifi- 
cielles x°+!, ...,x"+? par un facteur numérique noté traditionnellement M. 
Plus loin, on désignera les points de l’espace #,. p Par des lettres surmon- 
tées d’un trait : 
x = ‘xl, x, xt. x" tp, 
et leurs projections sur #, par les mêmes lettres sans trait : 
x = ‘xl, xl. 
Le point x sera identifié à 
(Uxl, x, 0, …, ON. 


Trois possibilités suivantes peuvent se présenter : 

1. Le M-problème est résoluble pour un M et a pour solution A dont 
toutes les coordonnées x?+/ (correspondant aux variables artificielles) sont 
nulles. Dans ce cas, le problème initial est résoluble et x, est sa solution. 

En effet, x, vérifie le système des contraintes du problème initial et, par 
suite, x, € SZ. De plus, les fonctions # et ÿ se confondent sur et, par 
suite, pour tout x de 


g(x) > min ÿ. (19) 
ré 


Si pour x, on a dans ce cas une égalité, la valeur de #(x,) est évidemment 
minimale sur . 

2. Il existe un M suffisamment grand pour lequel le M-problème est 
résoluble, mais l’une quelconque de ses solutions x, possède une coordon- 
née non nulle de numéro supérieur à #7. Dans ce cas, le polyèdre est un 
ensemble vide et le problème initial est irrésoluble. 

En effet, si.@n’est pas un ensemble vide, la résolubilité du M-problème 
entraîne, en vertu de (19), celle du problème initial et on a l’inégalité 


min © > min y. (20) 
ré A 


Notons € la plus petite des coordonnées strictement positives x+/ du 
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point x;. Il est évident que 
px) + Me < VX) = min ÿ. 
ÿ 


Prolongeons la fonction # sur l’espace CR ; suivant la formule 
(x) = w(x) et désignons min & et min 4 par #; et w., respectivement. 
4 L'é 


De la formule (20) il vient 


ou 


M < Po — Po . 
€ 

Ainsi donc, l’hypothèse que n’est pas un ensemble vide aboutit à 
l’existence d’un majorant pour le nombre M. Ceci démontre l’assertion 
énoncée. | 

Il découle de l’analyse des cas 1 et 2 que pour un M suffisamment grand 
il ne peut exister deux solutions x et x, du M-problème, telles que 
xiti = 0,i = 1, .….,p, mais existe un x*+/ # O. 

3. Le M-problème est irrésoluble pour des M suffisamment grands. 
Dans ce cas, le problème initial est aussi irrésoluble. 

En effet, supposons que le problème initial est résoluble. Dans ce cas, le 
problème dual est aussi résoluble, c’est-à-dire qu'il existe une matrice-ligne 
u® à m éléments pour laquelle u°4 > c, et la fonction wb prend la valeur 
maximale u0b. 

Pour simplifier les notations on posera que les variables artificielles 
sont introduites dans toutes les contraintes du problème initial. Dans ce 
cas, le problème dual du M-problème est formulé de la façon suivante : 
chercher une matrice-ligne uw à m éléments, telle que wb présente sa valeur 
maximale et soient vérifiées les contraintes 44 < cetu, < M pour tous les 
i = 1,...,m. Si M est plus grand que la coordonnée maximale de w,, alors 
u, vérifie le système des contraintes du M-problème dual, et ce système de 
contraintes est compatible. La fonction ub étant bornée sur l’ensemble des 
solutions du système A < c, l’est encore après l’introduction de nouvelles 
contraintes. Il en découle que le M-problème dual est résoluble et par suite, 
est résoluble le M-problème. L’assertion est démontrée. 

Les estimations obtenues pour savoir lequel des M peut être considéré 
« suffisamment grand » sont pratiquement inutiles. En utilisant cette 
méthode de recherche de la base de départ, on organise les calculs de 
manière que M soit supérieur à tout nombre qu’on lui compare. Alors en 
résolvant le M-problème, on obtient que les Ak de la formule (15) sont 
strictement positifs et supérieurs aux autres A, pour # > n. Aussi les varia- 
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bles artificielles seront-elles exclues les premières du nombre des variables 
de base. Une fois qu’une variable artificielle sera exclue de la base, elle peut 
être tout à fait éliminée de l’examen. 

S’il n’y a pas de raisons de douter de la compatibilité du système de con- 
traintes du problème initial, on peut avec un certain risque (qui d’ailleurs 
n’est pas trop grand si l’on possède de l’expérience) fixer tout simplement 
pour M un nombre assez élevé. Si l’on obtient une solution du M-problè- 
me, dont les variables artificielles sont nulles, on peut dire que le choix de 
M a été bien fait. 

8. Cyclage. On a appelé problème dégénéré de programmation linéaire 
un problème dans lequel à un sommet au moins de l’ensemble polyédrique 
de points admissibles il correspond non pas une seule base mais plusieurs. 
Le phénomène est lié à l’annulation des variables de base, ou, en langage 
géométrique, au fait que par le sommet considéré il passe plus de n hyper- 
plans obtenus par transformation des contraintes du problème en égalités. 
Un sommet dégénéré peut être assimilé à deux (ou plusieurs) sommets con- 
fondus, ou à des sommets joints par une arête de longueur nulle. 

Dans l’étude de la méthode du simplexe on a supposé que le problème 
est non dégénéré. Or, dans la pratique, les problèmes dégénérés se rencon- 
trent assez souvent. Par exemple, si l’on débute par une base composée de 
colonnes correspondant aux variables isolées (voir point 7) et si dans la 
colonne des seconds membres il y a un élément nul, l’une des variables de 
base est égale à zéro, de sorte que le problème est dégénéré. 

Ainsi, l'hypothèse que le problème n’est pas dégénéré est trop restric- 
tive. Voyons les difficultés que peut entraîner la non-observation de cette 
restriction. La non-nullité des variables de base n’est pas en fait utilisée en 
elle-même. L’obstacle peut surgir du fait qu’à un même sommet sont asso- 
ciées plusieurs bases différentes. La projection du gradient de la fonction 
économique sur l’arête de longueur nulle n’est pas déterminée. Or, pour la 
recherche de la colonne qu’on doit éliminer de la base, on utilise non pas les 
projections mais les nombres A, calculés par la formule (15) et qui sont tou- 
jours définis. Donc, si la nouvelle base est associée à l’ancien sommet, on 
ne s’en observera qu’à la fin de l’étape en remarquant que ia valeur de la 
fonction économique n’a pas varié. 

Ainsi, par l’algorithme de la méthode du simplexe on passe à une autre 
base, mais on peut rester au même sommet, de sorte qu’après l’étape de la 
méthode du simplexe la valeur de la fonction économique ne diminue pas. 
Or cela ne signifie pas encore que la recherche du minimum ne peut être 
menée jusqu’au bout. Mais il peut arriver qu’avec la règle adoptée de choix 
d’une colonne exclue de la base et d’une colonne introduite dans la base, on 
passe d’une base, associée au sommet considéré, à une autre base et 
qu’après une série d'étapes, on revienne à la base de départ. Ce phénomène 
est appelé cyclage. 
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Il faut avoir en vue que le cyclage n’est pas engendré par la méthode 
même, mais est en rapport avec un problème secondaire concernant la règle 
de choix des colonnes introduites dans la base et exclues de la base. Cette 
règle peut être améliorée de manière que le cyclage n’apparaisse pas. Le 
procédé suivant est peut-être le plus simple du point de vue de l’argumenta- 
tion, mais il se peut qu’il entraîne une longue suite de calculs inutiles. S'il 
apparaît plusieurs variables, dont chacune peut être exclue de la base, cette 
variable est choisie de façon arbitraire. Vu que parmi les variables il y en a 
toujours celles dont l’exclusion de la base fournit une base associée à un 
autre sommet, quelques essais suffisent pour éliminer l’une d’elles. 

Il existe aussi des procédés plus perfectionnés de lutte contre le cyclage, 
mais on n’y s'arrêtera pas. Le cyclage est un phénomène si rare qu’on est 
souvent obligé d’inventer spécialement des exemples de problèmes où il 
peut apparaître. Néanmoins, il faut toujours tenir compte de la possibilité 
de se heurter à un cyclage. 


8 5. Applications de la programmation linéaire 


1. Problème de transport. De toutes les applications de la programma- 
tion linéaire on ne s’attachera ici qu’à quelques-unes. Aussi rigoureux que 
soit le choix de ces quelques applications, il semble qu’il faille choisir en 
premier lieu le soi-disant problème de transport. C’est un des premiers 
modèles d'optimisation linéaires, élaboré en 1939, avant que la program- 
mation linéaire devienne une branche de mathématiques autonome. Pour 
le résoudre on a proposé une série de procédés devenus méthodes classiques 
de programmation linéaire. 

Dans le cas le plus simple le problème de transport est formulé de la 
façon suivante. On considère m fournisseurs d’un certain bien et ses 7 con- 
sommateurs. Posons que les fournisseurs disposent des stocks de biens 
dj, …, 4, et que les consommateurs doivent recevoir respectivement b,, …, 
b,, unités de ce bien. Sont donnés les coûts de transport de l’unité du bien 
de chaque fournisseur à tout consommateur Ci À = ],..,m,7 = 1, 
n. Il faut dans ces conditions établir le schéma des transports, c’est-à-dire 
indiquer pour tout couple ij la quantité de bien x;; transportée du i-ième 
fournisseur au j-ième consommateur. De plus, il faut satisfaire les besoins 
de tous les consommateurs de la façon la plus économique et assurer la 
livraison de tous les biens des fournisseurs. 

Il va de soi que ces exigences ne seront satisfaites que dans le cas où 
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Si cette condition est satisfaite, le problème de transport est dit équili- 
bré. Dans le cas général, le problème se réduit facilement au problème équi- 
libré par introduction d’un fournisseur fictif ou d’un consommateur fictif. 

Toutes les exigences imposées au schéma de transport, y incluse la sous- 
entendue positivité des nombres x;,, peuvent être écrites sous la forme du 
problème suivant de programmation linéaire : 


ñ 
y X;; = b;, 3 X; —_ a;, 
Ed 
x;,, > 0, D  n 


Le problème comprend mn variables et m + n contraintes-égalités. La 
représentation du problème ne diffère de la forme canonique que par le fait 
que les contraintes sont linéairement dépendantes. On se convainc facile- 
ment de l’existence de la dépendance linéaire : la somme des égalités du 


premier groupe 
,J J 


est la même que la somme des égalités du deuxième groupe 


Xÿ = L a; 
ï, 
(le problème est supposé équilibré). On n’élimine pas la dépendance 
linéaire des équations pour ne pas troubler la symétrie. 

Notons T la matrice du système des contraintes. Chacune de ses colon- 
nes contient deux unités et m + nr — 2 zéros. Pour mieux nous représenter 
la structure de cette matrice, écrivons-la pour le cas de m = 2,n = 3.Les 
variables et les seconds membres des contraintes sont écrits pour identifier 
les colonnes et les lignes 


Xi, Xi2 Xy3 Xa) Xa2  X23 


[1 1 1 O0 Oo oO fa, 
0 O0 O0 1 1 1 }a; 
T=l1 0 0 1 o o |». 
[O 1 O0 O0 1 Oo db, 
1[O O 1 O0 O0 1 ho, 


La matrice a de grandes (comparées à m et 7) dimensions et une struc- 
ture creuse. Aussi est-il naturel d’organiser les calculs de manière à ne pas 
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transformer la matrice. Grâce à sa structure spéciale cela est possible. 
Démontrons la propriété remarquable suivante de la matrice T. 


PROPOSITION 1. Toute sous-matrice régulière de la matrice T peut par 
permutation de lignes et colonnes être réduite à la forme triangulaire. 


Démontrons d’abord que dans toute sous-matrice régulière T° de T'il 
existe obligatoirement une colonne contenant une unité. En effet, si toutes 
les lignes de la sous-matrice appartiennent au premier (ou second) groupe 
de lignes de la matrice T, chaque colonne contient une unité. Mais si la 
sous-matrice contient des lignes de différents groupes, additionnons les 
lignes du premier groupe et otons de la somme obtenue la somme des lignes 
du second groupe. Si chaque colonne renferme deux unités, ces unités sont 
situées dans les lignes de groupes différents et la différence obtenue est une 
ligne nulle. 

Plaçons la colonne contenant une unité à la première place et transpo- 
sons la ligne où se situe cette unité également à la première place. Mainte- 
nant on constate aisément que la sous-matrice 7 ” de 7’, située à l’intersec- 
tion des lignes et colonnes de nouveaux numéros supérieurs à un, est égale- 
ment régulière. En reprenant les mêmes raisonnements que pour T”, déga- 
geons la matrice T°”, etc. 

Ainsi, en un nombre fini d’étapes, on transformera la matrice T° en 
matrice triangulaire supérieure. 

Remarquons que chaque colonne de la matrice obtenue contient 
au-dessus de la diagonale une unité au plus, les autres éléments étant nuls. 
En outre, tous les éléments diagonaux sont aussi égaux à 1. On a donc la 


PROPOSITION 2. Tout mineur principal de la matrice T est égal à l'unité 
en valeur absolue. 


Déterminons maintenant le rang de la matrice T et en même temps indi- 
quons le procédé de construction d’un sommet de l’ensemble polyédrique 
SF des points admissibles du problème de transport. 

Considérons une matrice C d’éléments c;.. Soit C3 = min c; et 


a, < b,. En posant x,, = a, etx,; = 0 pour tous les / # B, excluons de 
la discussion ultérieure la ligne de la matrice C de numéro « et remplaçons 
le nombre b, par b, — a. 

Si a, > b,, on pose x, = b, et x;; = 0 pour i # a. On remplace a, 
par a, — b, et l’on exclut de la discussion la colonne de la matrice C de 
numéro f. 

En cas d’égalité, on peut exclure de la même façon soit la ligne soit la 
colonne, au choix. Si l’on exclut par exemple une ligne, b, est remplacé par 
zéro. Toutefois, si dans la matrice il y a une ligne et plusieurs colonnes, on 
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exclut la colonne, et s’il y a une colonne et plusieurs lignes, on exclut la 
ligne. 

Une telle attribution des valeurs aux variables x. correspond à l’expédi- 
tion, suivant l’itinéraire le moins couteux, d’autant de biens qu’il est possi- 
ble, en satisfaisant de ce fait les besoins d’un consommateur ou en épuisant 
les stocks d’un fournisseur. 

Après quoi on applique à la partie restante C ” de la matrice C le même 
processus jusqu’à ce que soient exclues toutes les colonnes et les lignes. Il y 
a en tout m + n colonnes et lignes et à chaque étape, sauf la dernière, est 
exclue une ligne ou une colonne. A la dernière étape, sont exclues et la ligne 
et la colonne. Ainsi, le processus comprend m + n — 1 étapes, si bien que 
la matrice construite X = Ix;.l contient m + n — 1 éléments non néces- 
sairement nuls. 

Démontrons que les éléments de la matrice X ainsi construite vérifient 
le système des contraintes du problème de transport et que les variables 
dégagées sont des variables de base. Pour le démontrer, passons encore une 
fois en revue le processus de construction de la matrice X. Pour fixer les 
idées, posons qu’à la première étape on a exclu une ligne. La valeur de la 
variable Xi 8 dégagée à la première étape est parfaitement définie d’après 
a, €t b L à condition que Ai 0 pour tous les / Æ B. Cette valeur est 


telle que l’équation de numéro a, du premier groupe est vérifiée. 
La matrice diminuée C ‘ correspond au problème de transport équilibré 
dans lequel le nombre de consommateurs est diminué de 1, et bg, = bg — 


— &a,. La variable X 82 dégagée à la deuxième étape est aussi parfaitement 
définie d’après a et bg,» à condition que x, = 0 (ou respectivement 
X;g, = 0, si à la deuxième étape on a exclu une colonne). Vu que a, et b, 


sont définis d’après a. et b; , la valeur x, 8 St parfaitement définie d’après 
a; et b;, et est satisfaite une contrainte correspondant à la matrice diminuée. 
Si 8, = B,, cette contrainte diffère de celle du problème initial, mais en 


tenant compte de la valeur x, , et de la variation de b,, on constate qu'est 


aussi vérifiée la contrainte du problème initial. 

En raisonnant de la sorte, on obtient en fin de compte une matrice 
réduite à une ligne et à une colonne et deux nombres égaux a et b. On sup- 
pose que la dernière variable est égale à a, de sorte que les deux dernières 
équations qui restent se voient vérifiées. 

Ainsi, toutes les équations sont vérifiées, et les variables dégagées sont 
définies parfaitement comme polynômes linéaires par rapport à a,, ..,a,, 
et b,, …, b,, à condition que les autres variables soient nulles. Cela veut 


dire que les variables dégagées sont de base. Il en découle que 
ReT=mMm+n— I. 
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Remarquons que l’exigence de choisir à chaque étape l’élément minimal 
de la matrice C n’a été nullement utilisée. On aurait pu choisir chaque fois 
le premier élément venu (par exemple, l’élément supérieur gauche). Le 
choix de l’élément minimal fournit un sommet du polyèdre plus proche de 
la solution du problème. D’autre part, il existe des méthodes dont la réali- 
sation est plus compliquée mais qui permettent d'obtenir des solutions ini- 
tiales meilleures. 

On constate que la construction de 14 vase de départ dans le problème 
de transport ne présente pas de difficultés. 

La structure décrite du mineur principal de la matrice 7 montre que les 
calculs suivant les formules (10), (15) et (16) du $ 4 s'effectuent de façon 
très simple : pour résoudre les systèmes correspondants d’équations linéai- 
res il faut faire assez peu d’additions et de soustractions et on n’a absolu- 
ment pas besoin de multiplications et de divisions. Par conséquent, toutes 
les difficultés rencontrées dans l’application de la méthode du simplexe au 
problème de transport se réduisent au choix des variables qu’on introduit 
dans la base et qu’on exclut de la base. Cela permet de créer pour le pro- 
blème de transport une modification de la méthode du simplexe d’un assez 
haut rendement. Cette modification (dénommée méthode des potentiels) a 
été construite avant la méthode du simplexe générale. On n'’étudiera pas la 
méthode des potentiels en lui préférant l’étude d’autres problèmes liés au 
problème de transport. 

2. Problème du flot maximal. Parmi les problèmes proches du pro- 
blème de transport, étudions le problème du flot maximal dans un réseau 
de transport. On envisage dans ce problème un flot de marchandises ou 
d’autre chose (par exemple, de liquide) suivant un réseau de communica- 
tions reliant certains sommets ou nœuds du réseau. Les arcs constituant le 
réseau sont supposés orientés. Si le mouvement entre deux nœuds est possi- 
ble dans deux directions, on considérera que les nœuds sont réunis par 
deux arcs orientés de façon opposée. 

A chaque arc constituant le réseau est associée une capacité, c’est-à-dire 
un nombre qui fixe la valeur maximale de débit dans cet arc. En certains 
nœuds se vérifient les équations d’équilibre : l’ensemble de flots entrant 
dans le nœud est égal à l’ensemble de flots sortant de ce nœud. Mais il 
existe des nœuds où ces ensembles de flots sont différents. Ces nœuds cons- 
tituent les origines (entrées) ou destinations (sorties) suivant le signe du 
débit somme. Il est toujours possible d'introduire des arcs complémentai- 
res de capacités correspondantes pour réunir toutes les origines en une seule 
et toutes les destinations en une seule. 

Au modèle de réseau décrit on peut associer plusieurs problèmes d’opti- 
misation. Le problème du flot maximal a pour objectif de rechercher la 
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valeur maximal du débit de l’origine vers la destination, qui soit compatible 
avec les capacités données. 

Posons que le réseau comprenne 7 nœuds outre l’origine et la destina- 
tion. Attribuons à l’origine le numéro 0 et à la destination le numéro 
n + 1. Le réseau peut être défini par une matrice D d’ordren + 1. Un élé- 
ment d.,i = 0,...,n;/j = 1, ..., n + 1, de cette matrice est égal à la 
capacite de l’arc si les nœuds ; et / sont réunis par un arc et à zéro dans les 
autres cas. En particulier, les éléments diagonaux d, sont nuls. 

Il faut remarquer que pour la plupart des réseaux réels la matrice D est 
creuse et, par suite, rien ne sert de l’écrire entièrement. Les données sur le 
réseau peuvent être aussi mémorisées sous d’autres formes. Toutefois, 
pour des raisonnements théoriques il est commode de se servir de la repré- 
sentation matricielle. 

Notons x:. la valeur du débit dans l’arc du i-ième nœud vers le j-ième. 
Pour simplifier l’écriture des équations posons que les valeurs des débits 
sont définies pour tous les couples i, j, i = 0, ..,n;j = 1,...,n + 1,et 
qu’on associe aux arcs manquants les capacités et flots nuls. Dans ce cas, 
les contraintes imposées aux flots par les capacités des arcs prennent la 
forme de 


0 < x; < d, (1) 


pour tous les couples à, J. 
L’équation d’équilibre en j-ième nœud, / = 1, .…, n, peut être écrite 
ainsi : 


n+) 


Lx — D xx = 0. (2) 
i=0 K=] 


Il ressort de l’équation d’équilibre que la somme des débits sortant de l’ori- 
gine doit être égale à la somme des débits aboutissant à la déstination : 


n+) 


D Ko = D Xonsi (3) 
J=i 


j=0 


La dernière équation peut aussi être prise pour équation d'équilibre si 
l’on suppose que la destination et l’origine sont réunies par un arc de 
grande capacité qui renvoit à l’origine tout ce qui a été écoulé à travers le 
réseau et réunit ainsi l’origine et la destination en un seul point. 

Par valeur du flot dans le réseau on entendra le premier membre de 
l'égalité (3). Cette somme doit être rendue maximale à condition que soient 
vérifiées les contraintes (1), (2). 

Pour réduire le problème à la forme canonique, introduisons des varia- 
bles supplémentaires Yji= 0,...,n;j = 1,...,n + 1, telles que les con- 


$ S] APPLICATIONS DE LA PROGRAMMATION LINÉAIRE 581 


traintes imposées aux capacités s’écrivent sous la forme d’égalités 
Xj + y; = di. (4) 


Les variables supplémentaires y.. sont positives. 

La matrice S du système des contraintes (2), (4) possède deux groupes 
de lignes : les lignes du premier groupe sont constituées des coefficients des 
équations (2) et les lignes du second, des coefficients de (4). Chaque varia- 
ble X; figure avec un coefficient non nul dans deux équations du premier 
groupe : dans l’une d’elle, elle intervient dans la première somme, et dans 
l’autre, dans la seconde. A chaque variable X;; correspond une équation du 
second groupe, laquelle contient la variable };; avec les mêmes valeurs des 
indices. 

Ainsi, la colonne de la matrice S correspondant à la variable x. contient 
trois éléments non nuls, à savoir, +1 et —1 dans les lignes du premier 
groupe et + 1 dans les lignes du second groupe. Les colonnes correspon- 
dant aux variables y. contiennent une unité. Par analogie à la proposition 1 
on peut démontrer |a 


PROPOSITION 3. Chaque sous-matrice carrée régulière extraite de la 
matrice S du système de contraintes (2), (4) peut par permutation de lignes 
-et colonnes être réduite à la forme triangulaire. 


Il suffit de démontrer que chaque sous-matrice régulière possède une 
colonne avec un élément non nul. Démontrons-le. 

Si la sous-matrice renferme une colonne correspondant à AE la 
démonstration n’est pas nécessaire : l’unique unité de cette colonne doit 
être contenue dans la sous-matrice. On admettra donc que ces colonnes ne 
figurent pas dans la sous-matrice considérée. 

Si la sous-matrice ne contient que des lignes du second groupe, chaque 
colonne renferme une seule unité. Mais si les lignes appartiennent aux deux 
groupes, le déterminant de la sous-matrice se décompose en produit du 
mineur contenant toutes les unités des lignes du second groupe par son 
mineur associé, situé entièrement sur les lignes du premier groupe. Le pro- 
blème se ramène ainsi à l’étude des sous-matrices contenues entièrement 
dans les lignes du premier groupe. A ces sous-matrices on applique la 
démonstration par absurde, absolument analogue à celle qui a été faite 
pour la proposition 1. 

Il est évidemment inutile d’introduire dans la matrice S des colonnes 
correspondant à des variables égales à zéro. La représentation de la matrice 
est fonction du mode de définition choisi pour le réseau. Il nous faut toute- 
fois noter que la proposition 3 reste encore vraie si on exclut de la matrice S 
des colonnes quelconques. 

Posons que la matrice S contient des colonnes correspondant à N cou- 
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ples différents de valeurs d'indices (ÿ, /). L'ensemble des variables de base 
d’une base quelconque contient obligatoirement pour chaque OUI (4, : ) 
soit Xi; soit Vi soit ces deux variables, vu que l’équation Xi + Yi 
comme toute équation, doit contenir au moins une variable de Disc L 
conséquence, les couples (i, j) se répartissent en trois classes : 

G, : les deux variables x. et y;: sont de base ; 

G, : la variable x est de base, y.. ne l’est pas ; 

G, : la variable y. est de base, X;; ne l’est pas. 
Le nombre de couples de la première classe peut être calculé. Si ces couples 
sont au nombre de K, les autres sont au nombre de N — k et le nombre 
total des variables de base est 24 + N — K. Or le nombre de variables de 
base est égal à celui d’équations indépendantes, c’est-à-dire à #7 + N.Ilen 
découle que Æ = 

Considérons la sous-matrice composée des colonnes de base et permu- 
tons les lignes et les colonnes de manière que les colonnes correspondant 
aux variables de base } soient les dernières et les lignes contenant des uni- 
tés dans ces colonnes soient de même les dernières. Il s'ensuit que la sous- 
matrice donnée se décompose en blocs : 


fs] 
S) S; 
Il est évident que det S, # 0 et que S, doit contenir la colonne renfermant 
un seul élément non nul. Or S, contient toutes les lignes du premier groupe 
et, par suite, cette colonne ne peut être que la colonne correspondant à la 
variable x,; où a x, ,,,. De plus, la deuxième unité de cette colonne n’inter- 
vient pas dans S,, “donc le couple (0, i) ou (/, n + 1) se rapporte aux couples 
de la première classe G.. 

Formulons le dual du problème du flot maximal. Pour le problème de 
maximisation d’une fonction, étant donné la forme canonique des con- 


traintes, le problème dual peut être formulé de la façon analogue au pro- 
blème (4) du $ 4 : 
YA 2 cc, yb — min. 
Dans le cas considéré, le problème dual contient # variables u, correspon- 
dant aux contraintes (2), et N variables v; correspondant aux contraintes 
(4). On peut admettre que u, correspondent aux nœuds du réseau et v.. à ses 
arcs. Le système des contraintes du problème dual est de la forme 
u, + vy 2 À, 
Ut uns, > 0, 
u +u +, > 0, 
v,;, > 0. 
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Ici et plus loin les indices prennent les valeurs suivantes : i = 0, 
j=1,...,n+1;k,1 = 1,...,n quise combinent dela façon eee 
car le te contient des Ontrainies pour les seuls couples d’indices qui 
correspondent à N variables x. du problème primal. 

Posons que u}, VE est la solution du problème dual et x*, Ji la solution 
du problème primal. “Supposons que le problème est non dégénéré et consi- 
dérons la base du problème primal correspondant à la solution. On dira 
que l’arc du réseau et la variable Vi; appartiennent à la classe G,, G, ou G, si 
le couple d’indices correspondant (i, j) se rapporte à cette classe. 

Pour les couples d'indices de la classe G, on a Xÿ > 0, }ÿ > 0. Cela 
veut dire que l’arc est chargé par un débit qui ne dépasse pas ‘sa capacité. 
Selon la proposition 3 du $ 3, u/°et vi vérifient les relations : 


uÿ = 1] si 0,KeG,, 
uÿ = 0 si k.n+1ecG,, 
uŸ = u) Si k, le G,, 
v5 = 0 si je G.. 


Pour u, on a ici 7 relations indépendantes, autant que le nombre de couples 
cars G,. Faisons correspondre à l’origine u* = 1 et à la destination 
UF, = 0. On peut alors en déduire que u*= 1 pour tous les nœuds du 
réseau reliés à l’origine par des arcs non surchatsés à la limite, et u* = 0 
pour les nœuds reliés à la destination par des arcs non chargés. Ceci etant, 
chaque variable u, possède la valeur u” égale à zéro ou à l’unité. 
Pour les couples d’indices de la classe G, on a x? > 0, }ÿ = 0. A cette 
classe appartiennent les arcs surchargés à la limite. ‘On a pour ces derniers 


# S — 1% 
Ld % — 1 
D TS k.n+1eG.. 


Il s'ensuit que pour i, je G,onau*= let u*= 0. Cela veut dire que les 
arcs surchargés à la limite relient les nœuds pour lesquels u*= 1 avec les 
nœuds pour lesquels u* = 0. 

Pour les couples d'indices de la classe G, on a x? = 0, y* > 0. Ce sont 
des arcs non chargés qu’on aurait pu exclure du réseau sans modifier le flot 
maximal. Il vient 


VE = 0 si ,jeG, 
et 

u<uÿ Si k,leG,, 
ce qui signifie que les arcs libres relient les sommets pour lesquels u# = 0 à 
ceux pour lesquels u*= 1. 
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La fonction économique du problème dual est 
> dv. 
4, J 
En vertu de ce qui a été dit plus haut, sa valeur minimale vaut 


"L dvi = y d;. (S) 


i, jeG2 


Dans la dernière somme, la sommation ne s’étend qu’aux couples de la 
classe G, car pour eux seuls vf est différent de zéro. 

Voyons l’interprétation de ce résultat en termes du réseau. La somme 
(5) est la somme des capacités d’un ensemble d’arcs. Introduisons la défini- 
tion suivante. 


DÉFINITION. Admettons que l’ensemble des nœuds du réseau est subdi- 
visé en deux sous-ensembles disjoints # et %, et que l’origine appartient à 
# et la destination à %. L'ensemble de tous les arcs dont l’origine appar- 
tient à % et l’extrémité à est appelé coupe du réseau. La somme des 
capacités de tous les arcs de la coupe sera appelée capacité de cette coupe. 

L'introduction du terme « coupe » s’appuie sur la propriété suivante. 
Considérons un chemin allant de l’origine à la destination. C’est une suite 
de nœuds u,, u,,…, u;,u,,, dont chacun est relié au suivant par un arc. 


La suite commence à l’origine u, et aboutit à la destination u,,,. Quelle 
que soit la coupe du réseau, chaque chemin allant de l’origine à la destina- 
tion contient obligatoirement un arc de cette coupe. En effet, suivons le 
chemin en notant auquel des sous-ensembles % ou % se rapportent les 
nœuds traversés. On commence par un nœud de % et l’on doit aboutir à 
un nœud de #. Aussi doit-on passer quelque part de % à Z. 

Si l’on rapporte à 4 les nœuds pour lesquels u*= 1 et à Z ceux pour 
lesquels u° = 0, cette répartition définira la coupe composée des arcs de la 
classe G,. La somme (5) est la capacité de cette coupe. 

On dira que la coupe est de capacité minimale si sa capacité est infé- 
rieure à celle de toute autre coupe. On voit aisément que la valeur du flot 
maximal dans le réseau ne peut dépasser la capacité minimale de la coupe. 
En effet, avant d’atteindre la destination, le flot maximal doit passer dans 
l’ensemble , définissant la coupe de capacité minimale. 

Maintenant le théorème de dualité appliqué au problème du flot maxi- 
mal peut être formulé de la façon suivante. 


THÉORÈME 1. La valeur du flot maximal dans un réseau est égale à la 
capacité minimale de la coupe de ce réseau. 
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3. Programmation linéaire en nombres entiers. Une série d'importants 
modèles pratiques conduit aux problèmes de programmation linéaire avec 
une condition supplémentaire imposée à toutes (ou certaines) variables 
d’être entières. 

Supposons par exemple qu’aux points 4, i = 1, .…., m, on a organisé 
la production d’un bien en quantités a; dont le coût est f. Les consomma- 
teurs aux points B. ont des demandes b ,j = 1,...,n,qu’'on doit satisfaire 
de la façon la plus économique en tenant compte des coûts C; de transport 
de À, à B.. 

On aboutit ainsi au problème de programmation linéaire à fonction 


économique 
L GX + Li 
ï, j i 


où y, = 0 ou 1 suivant que la production est organisée au point À; ou ail- 
leurs. Ce problème appelé problème simple de distribution de la production 
est du même genre que celui de transport, étant toutefois plus compliqué à 
cause justement de la condition imposée à y; d’être entier. 

On aurait pu croire que la solution d’un problème de programmation 
linéaire en nombres entiers peut être obtenue comme une solution convena- 
blement arrondie du problème de programmation linéaire ordinaire si on 
rejette les conditions l’obligeant à être entière. Mais en réalité une telle opi- 
nion est fausse, comme le montre la figure 58. Sur cette dernière, la partie 
hachurée représente l’ensemble polyédrique des points admissibles du pro- 
blème de programmation linéaire à deux variables, et le vecteur c indique la 
direction du gradient de la fonction économique. La solution X du pro- 
blème de programmation linéaire discrète diffère sensiblement de la solu- 
tion Ÿ du problème continu. 

Les problèmes de programmation linéaire discrète, considérés sous 
l’angle des questions soulevées par leur résolution et des méthodes permet- 
tant de les surmonter, sont beaucoup plus proches des problèmes généraux 
de programmation discrète que des problèmes de programmation linéaire. 
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Il existe toutefois quelques problèmes discrets dont la solution peut être 
obtenue à partir du problème linéaire correspondant. Ils sont liés aux pro- 
blèmes de transport et de réseau déjà étudiés, dont l’un sera maintenant 
abordé. 

Le problème d'affectation se présente ainsi. Soient #7 postes et autant de 
candidats à ces postes, chaque candidat satisfaisant de façon différente aux 
exigences imposées pour occuper chacun de ces postes. (Il se peut, évidem- 
ment, que ce soient non pas des postes et des candidats devant les occuper, 
mais disons, des entreprises de construction et des machines qui y sont utili- 
sées, etc.) Admettons que le profit attendu de l’affectation du i-ième candi- 
dat au /-ième poste est Cij» 1,]j = 1,...,n. Hest nécessaire d’établir une telle 
liste d’affectations des candidats aux postes qui rende maximal le profit 
total. 

De par sa nature, le problème n’est aucunement lié à la programmation 
linéaire, et la première idée venue est de faire le dénombrement de n! listes 
d’affectations possibles. Cependant, si nr est assez élevé, ce procédé est peu 
attirant. En programmation discrète, on étudie divers procédés de dénom- 
brement des variantes qui permettent de ne pas les passer toutes en revue et 
d’exclure par groupes entiers celles qui sont non conformes au problème. 
Essayons toutefois de poser le problème de programmation linéaire. 

Introduisons les variables x;; et admettons que x.. = 1 si le ;-ième candi- 
dat est affecté au j-ième poste, et x; = 0 s’il n’y est pas affecté. Dans ce 
cas, le profit attendu de l’adoptation de la liste définie par la matrice 


X = EPL est égal à 
D Cx- (6) 
i,J 


Cette somme doit être rendue maximale à la condition que X est une 
matrice de permutation, c’est-à-dire que chacune de ses lignes et chacune 
de ses colonnes contiennent une unité et une seule, les autres éléments étant 
nuls. 

Si X est la matrice de permutation, on a 


x >0 Dx=r Vx=l Q 


Toutefois, ces conditions sont évidemment insuffisantes et ne garantissent 
pas que toutes les variables X; soient égales à 1 ou à 0. 

Ainsi, la solution du problème de maximisation de la somme (6) avec 
conditions (7) fournit la solution du problème d’affectation si ses compo- 
santes x;. sont nulles ou égales à l’unité, et ne résout pas le problème dans le 
cas contraire. 
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Remarquons que le problème formulé diffère du problème de transport 
par le seul fait qu’on doit maximiser la fonction donnée et non pas la mini- 
miser. Cette différence n’a aucun rapport aux propriétés de la matrice du 
système de contraintes, si bien que cette matrice vérifie la proposition 2. Il 
ressort aussitôt de la proposition 2 la propriété des solutions entières du 
problème de transport : si les nombres a; et b; sont des entiers, tous les som- 
mets du polyèdre . des points admissibles du problème de transport n’ont 
que des coordonnées entières. 

Notons qu’une propriété analogue des solutions entières du problème 
du flot maximal découle de la proposition 3 si les capacités sont des nom- 
bres entiers. 

Ainsi donc, on peut être sûr que pour un problème avec contraintes (7) 
le maximum de la fonction (6) est atteint au point de coordonnées entières. 
Si la solution n’est pas unique, il y aura aussi parmi les solutions des non 
entières, mais la solution entière existe obligatoirement. Les variables entiè- 
res x;; sont positives et les sommes dans (7) sont égales à l’ünité, si bien que 
chaque X;; est égale soit à zéro, soit à l’unité. 

On voit que la résolution du problème discret s’est ramenée à celle d’un 
problème de programmation linéaire beaucoup plus simple et ceci grâce à 
la propriété de la solution entière du problème de transport. 

Un exposé détaillé de la théorie des problèmes de réseaux et de leur 
application aux problèmes de programmation discrète peut être trouvé 
dans le livre de Hu [15]. 

4. Jeux matriciels. Les jeux matriciels forment une classe importante de 
modèles étroitement liés à la programmation linéaire. 

Du point de vue mathématique on entend par jeu un processus dans 
lequel plusieurs personnes prennent des décisions. A la fin du processus, 
chaque participant aboutit à un gain (non nécessairement positif) qui 
dépend de ses décisions et de celles des autres joueurs. Outre les jeux au 
sens courant du terme, s’y rapportent les modèles de situations étudiés en 
stratégie et tactique, les modéles d’opérations boursières et nombre 
d’autres. 

Dans les jeux matriciels qu’on étudiera, participent deux personnes 
dont les intérêts sont opposés car la somme de leurs gains est nulle. Etant 
donné cette hypothèse, le jeu est dit anfagoniste ou à somme nulle. En réa- 
lité, les intérêts des joueurs peuvent aussi être opposés pour une somme de 
gains non nulle, mais ce cas se réduit facilement à celui de la somme nulle. 

La prise de décision est supposée unique, c’est-à-dire que le résultat du 
jeu est déterminé après que chacun des joueurs ait pris une fois la décision. 
Les décisions prises par les joueurs sont appelées stratégies. Dans les jeux 
tels que les échecs, les adversaires font plusieurs coups en prenant chaque 
fois une décision. Dans ce cas, le jeu est de la classe des jeux dynamiques. 
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Mais on peut imaginer une situation dans laquelle un joueur, avant de com- 
mencer le jeu, décide de tous les coups qu’il fera (il va de soi que pour les 
échecs, comme pour tous les jeux réels, ce n’est qu’une possibilité théori- 
que). Chacune de ces décisions constituera la stratégie du jeu à décision 
unique, si bien que le jeu reprend ainsi la forme normale. 

Pour les jeux de forme normale, il est supposé qu'aucun des joueurs ne 
possède d’information certaine sur la stratégie choisie par l’autre, autre- 
ment dit les décisions sont prises par les joueurs de façon indépendante. On 
entend par information incertaine l’information que le joueur peut extraire 
des résultats précédents s’il a déjà joué avec cet adversaire. C’est ainsi que 
si l'adversaire utilisait toujours la stratégie æ, on peut supposer qu'il la sui- 
vra encore. 

Les jeux matriciels appartiennent à la classe des jeux finis. Cela suppose 
que le nombre de stratégies de chaque joueur est fini. 

Toutes les hypothèses sont ainsi faites. Tout jeu antagoniste fini de 
forme normale est appelé jeu matriciel. Ce jeu peut être décrit par une 
matrice dont les lignes correspondent aux stratégies du premier joueur et 
les colonnes à celles du second. Un élément a;; de la matrice est le gain 
obtenu par le premier joueur s’il choisit une stratégie de numéro #, tandis 
que celle de son adversaire est de numéro j. Si les joueurs changent de rôle, 
les lignes dans la matrice deviennent colonnes et vice versa, et les éléments 
changent de signe. Ainsi, la matrice À se remplace par la matrice —‘4. Un 
jeu symétrique par exemple, dans lequel les deux joueurs sont dans une 
même situation doit avoir une matrice symétrique gauche. 

Il va de soi que pour définir un jeu il suffit de donner la matrice du pre- 
mier joueur. C’est ainsi qu’on agira, bien qu’on introduise de la sorte une 
certaine asymétrie dans les notations. On étudiera un jeu défini par la 
matrice À d'éléments a,1=1,...,m;j=1,...,n. Le premier joueur a 
m stratégies, le second, nr. On peut donc considérer que le jeu consiste en ce 
que le premier joueur choisit une ligne de la matrice, tandis que le second, 
indépendamment du premier, choisit une colonne. Si à l’intersection de la 
ligne et de la colonne se trouve l’élément a;;, le premier joueur obtient a;:et 
le second, — a; 

Ainsi, le premier joueur cherche à obtenir l’élément maximal de la 
matrice et le second, l’élément minimal. En conséquence, on dit parfois 
que le premier est joueur du maximum et le second, Joueur du minimum. 

S. Gains garantis. Admettons que le premier joueur est une personne 
très prudente, qui ne veut pas risquer et cherche à obtenir, si possible, un 
gain garanti, non pas le plus grand gain mais qui ne dépend pas des déci- 
sions du second joueur. Le premier joueur peut raisonner de la sorte : 
« Dans le pire des cas, j’obtiendrai le plus petit élément de la ligne choisie. 
Il faut donc choisir la ligne dans laquelle le plus petit élément est maxi- 
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mal ». Ainsi, soit i = 1, ..,m;j=1,...,net 


Bip = MAX min a;;. 
En choisissant la stratégie à, le premier joueur ne peut obtenir moins que 
dj quoi que le second joueur n’ait choisi. Pour d’autres stratégies il peut 


obtenir moins ou plus que a. oo € qui dépend déjà des décisions du second 


joueur. Mais si le second agit de façon prudente, le premier ne peut obtenir 
plus d’une certaine limite qu’on va établir. 
Le nombre max min a;; est appelé gain garanti du premier joueur. Le 
J 


nombre — max min a;; est la limite supérieure du gain du second joueur 
i j 


qu’il ne peut dépasser en cas de comportement prudent du premier joueur. 
Faisons un raisonnement analogue pour le second joueur. Pour obtenir 
un gain garanti il doit choisir la colonne dans laquelle le plus grand élément 
soit minimal, c’est-à-dire la colonne de numéro j, pour lequel 
a, = min max @;,. 
Ayant choisi la stratégie j,, le second joueur obtient un gain garanti égal 


à —min max a;;. Simultanément, on obtient que le nombre min max a;; est 
J J i 


la limite supérieure du gain du premier joueur qu’il ne peut dépasser en cas 
de comportement prudent du second joueur. 

Etablissons une relation entre les gains garantis des joueurs. Il est aisé 
de démontrer qu’on a toujours 


max min g.. < min max Ga... 
i ji j à 


Cela veut dire que la limite supérieure du gain est toujours supérieure au 

gain garanti. En effet, considérons la matrice-colonne p composée des élé- 

ments p; = min 4;,. Chacun des éléments de cette colonne est inférieur à 
J 


l’élément homologue de toute autre colonne : 
P, < a; J=1,...,n. 
Si le k-ième élément de p est le plus grand, on a tous les j = 1,...,n 
RARE, = D, ay; < ne a; 
Etant donné que p, est inférieur à chacun des #7 nombres, il est inférieur au 
plus petit d’entre eux : 
< min max a. 
ner ae mL 
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ce qui coïncide avec l’inégalité qu’il fallait démontrer. 
Les jeux pour lesquels se vérifie l’égalité 


max min a. = min max a. 
i pe M j i VU 


sont appelés jeux à valeurs complètement déterminées. Si a. . est l’élément 
égal aux deux membres de cette égalité, en choisissant la stratégie i, le pre- 
mier joueur obtient son gain garanti qui est en même temps son gain maxi- 
mal en cas de comportement prudent du second joueur. C’est le meilleur 
résultat auquel il peut espérer. De la même façon, le second joueur choisit 
la stratégie j, et gagne — a, jo" C’est la limite supérieure du gain du second 
joueur si le premier ne commet pas d'erreur. Si aucun des joueurs ne 
compte sur les erreurs de l’autre, le résultat du jeu est déterminé, d’où la 
dénomination de cette classe de jeux. 

Les stratégies i, et j, sont appelées stratégies optimales pures. 

Considérons à titre d’exemple un jeu à matrice 


2 1 
3 41 


Il est clair que le premier joueur doit choisir la deuxième ligne, et le 
second, s’il ne compte pas sur l’erreur du premier, doit choisir la première 
colonne. 

La situation change si l’on passe au jeu à matrice 


3 1] 
2 44 
Ce jeu n’est pas à valeurs déterminées vu que max min a; = 2et min max 4, = 
| i j i 


= 3. En recherchant son gain garanti égal à 2, le premier joueur doit choi- 
sir la deuxième ligne. Si en même temps le second joueur recherche égale- 
ment son gain garanti égal à — 3 et choisit la première colonne, il obtient le 
gain supérieur, égal à —2. On voit qu’avec ces stratégies le premier joueur 
se trouve dans une situation inférieure : il aurait pu obtenir 3 si en se fiant à 
la prudence du second il avait choisi la première ligne, auquel cas le second 
n’aurait obtenu que le minimum garanti. On voit que dans ce jeu il n’y a 
pas de stratégies optimales pures assurant les meilleurs résultats possibles 
aux deux joueurs qui jouent correctement. 
6. Stratégies mixtes. Considérons un jeu pour lequel 

Biojy — MAX min a; < min max dj = 4. 

Jusque-là on a posé que le jeu n’intervenait qu’une fois. Dans cette hypo- 
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thèse on ne peut continuer l’examen du cas étudié. Supposons donc que le 
jeu se répète plusieurs fois. 

Si dans ces multiples répétitions du jeu le premier joueur choisit cons- 
tamment la stratégie i,, le second joueur, en y comptant, choisira la straté- 
gie j,, de sorte que le premier obtiendra a, jo" Mais si le premier choisit con- 
tre toute attente la stratégie f,, son gain sera alors a; ., avec 

dj 2 dj, d jo: 
Mais s’il continue à choisir la stratégie i,, le second joueur, en le remar- 
quant, lui laissera le gain min a; qui est inférieur et même strictement infé- 


rieur à a, 

Dans un jeu à valeurs non complètement déterminées la bonne tactique 
est de choisir une stratégie au hasard, de manière que l'adversaire ne puisse 
deviner la stratégie qui sera choisie la prochaine fois. Avec un choix correct 
des stratégies et de leurs probabilités, une telle décision permet d’élever le 


gain moyen au-dessus de max min a;; sans le faire toutefois monter jusqu’à 
1 J 


min max 4. 
J 1. 

Supposons que x',i = 1,...,m, est la probabilité de choisir la stratégie 
i par le premier joueur et que y’, = 1,...,n, est la probabilité de choisir la 
stratégie / par le second joueur. Il est naturel que 


xD 0, x! +... + x" = 1] 
et 
M>O, pl +... + y1 = I]. 


Le gain du premier joueur représente maintenant une variable aléatoire 
dont l’espérance mathématique est facile à calculer. Vu que les stratégies 
sont choisies indépendamment, la probabilité de choisir un couple de stra- 
tégies (i, j) est x'y/ et par suite, l’espérance mathématique du gain du pre- 
mier joueur est 


J(x, y) = Ÿ a;x' y, 
li, 


ou sous forme matricielle ‘x 4 y. 

Les matrices-colonnes x = ‘lx!, ., x" et y = ‘ly!, ..…., y" | seront 
appelées stratégies mixtes du premier et du second joueur, tandis que les 
stratégies étudiées plus haut seront dites pures pour ne pas être confondues 
avec les stratégies mixtes. Les stratégies pures peuvent être considérées 
comme des stratégies mixtes définies par les colonnes de la matrice unité. 
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Du point de vue géométrique on peut se représenter les stratégies pures 
comme des vecteurs de base dans un espace m-dimensionnel (resp. 
n-dimensionnel), et les stratégies mixtes comme des combinaisons convexes 
de stratégies pures. Par exemple, l’ensemble de toutes les stratégies mixtes 
du premier joueur est représenté par l’enveloppe convexe de m points de 
l’espace affine m-dimensionnel, ces points n’appartenant à aucun plan 
(m — 1)-dimensionnel. Cet ensemble est le plus simple polyèdre de dimen- 
sion M, appelé simplexe m-dimensionnel. 

Etudions à quoi peuvent aboutir les joueurs s’ils utilisent les stratégies 
mixtes. Si le premier joueur choisit la stratégie x, il peut être certain que son 
gain sera supérieur à 


min ‘xAy. 
y 
Ce minimum existe car la fonction ‘x Ay est continue sur un ensemble fermé 


borné de valeurs de y pour un x fixé. Aussi le gain garanti du premier 
Joueur ne dépasse-t-il pas pour les stratégies mixtes 


sup min x Ay. 
x ŸY 
De façon analogue, en choisissant la stratégie y, le second joueur gagne 
au moins — max ‘x Ay et, par suite, s’il joue correctement, le gain du pre- 
x 
mier joueur ne dépassera pas 
inf max x Ay. 
y x 
On verra plus loin que ces bornes supérieure et inférieure peuvent être 


atteintes et, par suite, constituent un maximum et un minimum. Pour le 
moment, notons seulement qu’est vérifiée la suite d’inégalités suivante : 


min ‘xAy < sup min 'xAy < inf max x Ay < max 'xAy. (8) 
y x y y x x 
La démonstration n’est nécessaire que pour la deuxième inégalité. Il est évi- 
dent que pour tous x et y est vérifiée la double inégalité 
min x Ay < ‘x Ay < max 'xAy. 
LA x 


Vu que le troisième membre de cette inégalité est indépendant de x on a 
sup min ‘x Ay < max xAy. 
x y x 


Dans cette inégalité le premier membre est indépendant de y. Donc, 
sup min ‘x Ay < inf max ‘x Ay. 
x y y x 
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En fait, on a obligatoirement ici une égalité, ce qui constitue le théorème 
principal de la théorie des jeux matriciels qu’on démontrera plus loin. En 
attendant, l'inégalité obtenue est suffisante pour la démonstration de la 
formule (8). 

Démontrons encore que pour tout x on a 


. | i < . À : 
min L ax min f(x y) 
En effet, la définition de f(x, y) donne 
JG, y) = Xp Y a;xi. 
j Î 


Si l’on substitue à chaque somme intérieure la plus petite d’entre elles, on 
obtient l’inégalité 


f(x, y) > ( y )min La = min LUE 


Elle est vérifiée pour tous les y, en particulier pour celui qui réalise 
min f(x, y). L’inégalité est ainsi démontrée. On démontre de façon analo- 
y 


gue que 


max > a; > max L a;x y. 
J J 
7. Application de la programmation linéaire. Il découle des inégalités 
démontrées qu’en choisissant la stratégie x le premier joueur peut être cer- 


tain que son gain sera supérieur àv = min y a;;x' . La stratégie x satisfait 
i 


au système d’inéquations 
m 
y ax > uv, j=1,..,n, 
im] 


x! +... + x = 1 (9) 
x! > 0,...,x" > O0. 


Ceci étant, le premier joueur s’efforce de rechercher x de manière que v soit 
maximal. Pour réduire ce problème à un problème de programmation 
linéaire il faut transformer la matrice 4. Plus précisément, ajoutons à tous 
les éléments de À un même nombre suffisamment grand pour que tous les 
éléments deviennent strictement positifs. Ceci est équivalent à l’attribution 
au premier joueur d’une somme pour la participation au jeu. Cette trans- 
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formation n'’influe donc _pas sur le choix de la stratégie par chacun des 
joueurs. Posons ainsi a; = a; + æ et À = dl, où a > max| a; À. 


La somme v composée pour la matrice À est strictement positive on peut 
donc introduire des nouvelles variables 
£Ei=v-lxi, i= 1,...,m. 


Le système d’inéquations (9) de la matrice À devient alors 


El +... + Em = ut, 
£" > 0,...,87 > 0 


Maintenant le désir de maximiser v conduit au problème suivant de pro- 
grammation linéaire 


£i>0, i=1,...,m, 

El +... + ET — min. 
Ce problème peut être écrit sous la forme matricielle si l’on introduit la 
matrice-colonne i dont tous les éléments sont égaux à 1. On ne précisera pas 
le nombre d’éléments de à qui peut être égal soit à m, soit à n selon le cas. 
Le problème pour le premier joueur prend la forme 

AE > i, > 0, 
$ is $ : (10) 
if — min. 


Le problème est résoluble. En effet, la fonction économique est minorée 
Car on a évidemment v < max tx Ay. Le système des contraintes du pro- 


blème (10) est Écbauble. car tous les ä, > 0, et en choisissant 
£! > max à Ti , On rendra dans chaque inéquation un des termes plus 
J 


grand que l’unité. 
Construisons maintenant le problème pour le second joueur. Si le 
second joueur choisit la stratégie y, sa perte sera inférieure à 


= pl 
W = max L ä;,y’. Ceci étant, on a 


Ceci étant, on a 
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pl+.….+yt>l, 
y" >0,...,y" > 0. 


Les transformations analogues à celles qu’on a utilisées dans le problème 
pour le premier joueur réduisent le problème de minimisation de la perte 
maximale à la forme 


(A <i, n7>0, 
(gi — max, 


(11) 
où = w-ly. 

Il n’est pas difficile de remarquer que les problèmes du premier et du 
second joueur constituent un couple de problèmes duals. Le théorème 3 du 


$ 3 et la formule (9) entraînent que les solutions 4, et #, des problèmes (10) 
et (11) vérifient les égalités 


‘aoû = MA) = ‘Ëo- (12) 


Passons aux anciennes variables x et y en tenant compte de ce que£, et 1, 
correspondent à 


y = min DE 
Wp = max L à,}4- 
J 
En multipliant (12) membre à membre par v,w,, on obtient 
min L 4x0 = ty (À )xo = max L ae 
On peut maintenant revenir à la matrice initiale À. Il vient 
min L (a + a)xh = min L ax + @ Lx = min L 5x0 + a 
et 
max L (a + œ)yl = max L a + ©, 
J J 
ainsi que 
D Ca, + a)xiyh = Ÿ axipf + a Y'xiph = Ÿ a;xipf + a. 
i, J dj i, j 


â, j 
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Donc, 


min Ÿ' a.x! = 'y(fA)x. = max Ÿ a.y/. 
; L ÿ*o = Yo A) 2 ÿ)"0 
i J 
Il en découle immédiatement 
min y'Ax, = (A)x, = max ‘y, (‘A )x. (13) 
) x 


En effet, dans la double inégalité 


min D a;x6 < min y'Ax, < M(A)x, 
J J 
Î 


le premier membre est égal au troisième. Il en découle la première des égali- 
tés nécessaires, la seconde se démontre de façon analogue. 

Maintenant les inégalités (8) et les égalités (13) entraînent de façon iden- 
tique 


sup min 'xAy = inf max 'xAy = x, Ay. 
x y y x 


Il en découle non seulement l’égalité des bornes supérieure et inférieure 
mais aussi le fait que ces bornes sont accessibles. Le résultat obtenu peut 
être formulé sous forme de 


THÉORÈME 2. Pour tout jeu matriciel il existe des stratégies mixtes x, et 

yo Pour lesquelles 
max min (xAy = . max xAy = 'XA Yo. 

Le nombre 'x, À y, est appelé valeur du jeu, et les stratégies x, et y, stra- 
tégies optimales. Le couple de stratégies optimales (x,, y,) porte le nom de 
solution de jeu. 

Les stratégies optimales pures qui existent pour un jeu à valeurs com- 
plètement déterminées sont optimales en ce sens. On peut dire que le jeu est 
complètement déterminé si la valeur du jeu est égale à l’un des éléments de 
la matrice. 

Les égalités (13) montrent qu’après avoir choisi sa stratégie optimale x, 
le premier joueur s’assure un gain égal à la valeur du jeu. Il ne peut obtenir 
davantage si le second joueur choisit aussi sa stratégie optimale. Si l’un des 
joueurs choisit sa stratégie optimale, le second, en s’abstenant de le faire, 
ne peut que rendre moins bon son gain. 

Les stratégies optimales ne sont pas uniques, mais tout ce qui a été dit 
plus haut se rapporte à tout couple de stratégies optimales car chacune 
d’elles s’obtient d’une solution du problème correspondant de programma- 
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tion linéaire, et l’égalité (12) qui entraîne (13) a lieu pour tout couple de 
solutions des problèmes duals. 

L'ensemble des stratégies optimales du premier joueur par exemple, est 
une partie convexe dans l’ensemble de ses stratégies mixtes, et chacune des 
stratégies optimales est une combinaison convexe de stratégies pures. Deux 
stratégies optimales peuvent contenir différentes stratégies pures. Il se peut 
d’ailleurs qu’une stratégie mixte se décompose de deux façons différentes 
en une combinaison convexe de stratégies pures. 

Il ne faut pas oublier que la valeur du jeu est l’espérance mathématique 
du gain du premier joueur et que dans tous les cas on ne peut réaliser qu’un 
nombre fini de répétitions d’un jeu. Supposons que les joueurs ont adopté 
leurs stratégies optimales Ix!, …, xl et I y}, ..…, Gil et qu’à chaque répéti- 
tion du jeu les stratégies pures i et j sont choisies avec des probabilités x, et 
y respectivement. Alors le gain moyen du premier joueur tend vers la 
valeur du jeu lorsque le nombre de répétitions augmente. Tous les raison- 
nements sur les propriétés des stratégies optimales ne doivent être compris 
que dans ce sens-là. 

Peut-on profiter des stratégies mixtes si le nombre de répétitions est 
petit ou même se limite à un seul jeu ? La réponse à cette question ainsi que 
l’étude détaillée de la théorie des jeux matriciels peuvent être trouvées dans 
le livre de Luce et Raiffe [25]. 

En conclusion on aurait voulu faire une remarque sur le lien logique de 
quelques théorèmes de ce chapitre. Un des principaux théorèmes est le 
théorème de Farkas sur les inéquations déduites du système d’inéquations 
linéaires. Le théorème de dualité en programmation linéaire s’ensuit en fait 
immédiatement vu que sa démonstration n'utilise, outre le théorème de 
Farkas, que le principe de Dedekind de continuité de l’ensemble des nom- 
bres réels. A leur tour, le théorème du flot maximal et le théorème principal 
de la théorie des jeux matriciels ont été obtenus par application directe du 
théorème de dualité. La démonstration de la proposition 15 du $ 1, rem- 
plissant le rôle du lemme dans la démonstration du théorème de Farkas, est 
assez laborieuse. Mais, comme on le voit, les efforts dépensés à cette der- 
nière permettent d'aboutir à des résultats remarquables. 
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